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编程 简介 


深入 探讨 Python 编程 之 前 ， 先 大 致 了 解 
一 下 Python 是 什么 及 其 可 用 于 编写 哪些 类 型 
的 程序 ， 这 大 有 神 益 。 本 章 还 将 概述 程序 员 
所 做 的 工作 。 最 后 将 介绍 如 何 安装 Python 及 
运行 其 自 带 的 IDLE 编辑 器 。 


如 果 你 是 编程 新 手 ， 本 章 可 助 你 为 学 习 
Python 编程 语言 做 好 准备 。 


如 果 你 已 掌握 这 些 基 本 概念 ， 可 跳 到 有 
关 如 何 安装 Python 和 运行 编辑 器 的 章节 。 


本 章 内 容 
口 Python 语言 
口 Python 适合 用 于 做 什么 


口 程序 员 如 何 工 作 


口 安装 Python 


1.1 Python 语言 


那么 Python 是 什么 呢 ? 简单 地 说 ， 它 是 

种 计算 机 编程 语言 组 配套 的 软件 工具 

和 库 。Python 最 初 由 Guido van Rossum 于 20 

世纪 90 年 代 初 开发 ， 当 前 由 世界 各 地 的 数 十 
位 程序 员 (包括 van Rossum ) 负责 维护 。 


Python 易于 理解 和 学 习 。 相 比 于 用 其 他 
大 多 数 编程 语言 编写 的 程序 ，Python 程序 更 
整洁 : Python 几乎 没有 多 余 的 符号 ， 且 使 用 
的 是 简单 易 懂 的 英语 名 称 。 


Python 语言 的 效率 极 高 。 精 通 Python 后 ， 
与 使 用 其 他 大 多 数 编程 语言 相 比 ， 使 用 Python 
可 在 更 短 的 时 间 内 完成 更 多 的 工作 。Python 文 
持 但 不 强制 你 使 用 面向 对 象 编程 (OOP )。 


Python 自 带 了 各 种 现成 库 ， 供 你 在 自己 
的 程序 中 使 用 。 有 些 Python 程序 员 喜 欢 这 样 
说 : Python“ 开 箱 即 可 使 用 ”。 


Python 的 一 个 极其 实用 的 特点 是 易于 维 
护 。 鉴 于 Python 程序 理解 和 修改 起 来 相对 容 
易 ， 程 序 员 可 轻松 地 确保 它们 紧 跟 潮流 。 在 
程序 员 所 做 的 工作 中 ， 程 序 维护 所 占 的 比例 
很 可 能 高 达 甚 至 超过 50%， 因 此 在 很 多 专业 
人 十 看 来 ，Python 对 维护 的 支持 是 个 亮点 。 


最 后 ， 说 说 名 称 Python 的 由 来 。 据 Python 
之 父 Guido van Rossum 说 ，Python 是 以 喜剧 
团体 Monty Python( 巨 蟒 小 组 ) 的 名 字 命名 的 。 
虽然 这 种 起 源 充 满 喜 庆 色 彩 ， 但 Python 当前 
使 用 的 标识 确 乎 是 两 条 缠 在 一 起 的 蛇 〈 可 能 
是 蟒蛇 )， 其 中 一 条 为 蓝 色 ， 另 一 条 为 黄色 。 
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1.2 Python 适合 用 于 做 什么 

虽然 Python 是 一 种 通用 语言 ， 可 用 于 编 
写 任何 类 型 的 程序 ， 但 它 最 常用 于 编写 下 述 
应 用 程序 。 


口 脚本 。 这 些 简 短 的 程序 自动 执行 常见 
的 管理 任务 ， 如 在 系统 中 新 增 用 户 、 
将 文件 上 传 到 网 站 、 在 不 使 用 浏览 
的 情况 下 下 载 网 页 等 。 


口 网 站 开发 。 作 为 快速 创建 动态 网 站 的 
工具 ，Dijango ( www.djangoproject.com )、 
Bottle ( www.bottlepy.org ) 和 Zope ( www. 
Zope.org ) 等 众多 Python 项 目 深 受 开发 
人 员 的 欢迎 。 例 如 ， 深 受 欢迎 的 新 闻 
网 站 www.reddit.com 就 是 使 用 Python 
开发 的 。 


口 文本 处 理 。Python 在 字符 串 和 文本 文 
件 处 理 方面 提供 了 强大 的 支持 ， 包 括 
正则 表达 式 和 Unicode。 


口 科学 计算 。 网 上 有 很 多 卓越 的 Python 
科学 计算 库 ， 提 供 了 用 于 统计 、 数 学 
计算 和 绘图 的 函数 。 

口 教育 。 鉴 于 Python 简洁 实用 ， 越 来 
越 多 的 学 校 将 其 作为 第 一 门 编程 教学 


五 二 
JEr 百 。 


当然 , Python 并 非 对 任何 项 目 来 说 都 是 最 


佳 选 择 ， 其 速度 通常 比 Java、C#、C++ 等 语 
言 慢 ， 因 此 开发 新 操作 系统 时 不 会 使 用 Python。 


然而 ， 需 要 最 大 限度 地 减少 程序 员 花 在 


项 目 上 的 时 间 时 ，Python 通常 是 最 佳 选择 。 
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1.3 程序 员 如 何 工 作 


虽然 对 如 何 编写 程序 没有 严格 的 规定 ， 
但 大 多 数 程序 员 都 采用 类 似 的 流程 。 


该 程序 开发 流程 如 下 。 


1. 确定 程序 要 做 什么 ， 即 搞 清 楚 需求 。 


2. 编写 源 代 码 ， 这 里 是 使 用 Python 集成 


开发 环境 IDLE 


或 其 他 文本 编辑 器 编写 Python 


代码 。 这 一 步 通常 最 有 趣 也 最 具 挑战 性 ， 要 求 
你 创造 性 地 解决 问题 。Python 源 代码 文件 使 用 
扩展 名 .py, 如 web.py .urlexpand.py .clean.py 等 。 


3. 使 用 Python 解释 占 将 源 代码 转换 为 目 


标 代 码 。Python ; 


各 目标 代码 存储 在 .pyc 文 件 中 ， 


例如 ,如 果 源 代码 存储 在 文件 urlexpand.py 中 ， 


目标 代码 将 存储 在 文件 urlexpand.pyc 中 。 


4. 运行 或 执行 程序 。 就 Python 而 言 ， 通 
常 紧 接着 第 2 步 自动 完成 这 一 步 。 实 际 上 ， 
Python 程序 员 很 少 直接 与 目标 代码 ( .pyc 文 


件 ) 交互 。 


姨 = 
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将 源 代 码 转换 
为 目标 代码 


检查 输出 


5. 最 后 ,检查 程序 的 输出 。 如 果 发 现 错误 ， 
回 到 第 2 步 并 尽力 修复 错误 。 修 复 错误 的 过 
程 称 为 调 武 。 开 发 庞大 或 复杂 的 程序 时 ， 可 
能 大 部 分 时 间 都 用 在 调试 上 ， 因 此 经 验 丰 富 
的 程序 员 设计 程序 时 ， 会 尽力 采用 可 最 大 限 
度 地 减少 调试 时 间 的 方式 。 


如 图 1-1 所 示 ， 这 是 个 循环 往复 的 过 程 : 
编写 程序 ， 测 试 ， 修 复 错误 ， 再 测试 …… 直 
到 程序 正确 运行 。 


图 1-1 ， 基本 计算 机 程序 编写 步骤。 检查 
时 ， 通 常会 发 现 错误 。 为 修复 错误 ， 必 须 
“编写 源 代码 ” 


术语 说 明 


程序 输出 
回 到 步骤 


我 们 通常 将 .py 文件 的 内 容 称 为 程序 、 


源 代码 或 代码 。 


目标 代码 有 时 也 称 为 可 执行 代码 、 可 


执行 文件 或 软件 。 


图 灵 社 区 会 员 cindy 


1.3 ”程序 员 如 何 工作 5 
282694 专 享 尊重 版 权 


1.4 安装 Python 


Python 是 一 种 实践 性 语言 ， 下 面 来 看 看 
如 何在 计算 机 上 安装 它 。 


1.4.1 在 Windows 系统 上 安装 Python 
步骤 如 下 。 


1. 访问 Python 下 载 页 面 www.python.org/ 


download。 


2. 选择 最 新 的 Python 3 版 本 (其 名 称 类 
似 于 Python 3.x， 其 中 x 是 一 个 较 小 的 数字 )， 
这 将 打开 相应 的 下 载 页 面 ， 其 中 说 明了 如 何 
下 载 用 于 不 同 计算 机 系统 的 Python。 


3. 根据 计算 机 使 用 的 操作 系统 ， 单 击 相 
应 的 安装 程序 链接 。 例 如 ， 如 果 是 Windows 
操作 系统 ， 单 击 Windows x86 MSI Installer 
(3:X)s 


4. 下 载 完 毕 后 ， 双 击 安装 程序 以 运行 它 。 


5. 安装 完成 后 (需要 几 分 钟 )， 通 过 测试 
看 看 是 否 正 确 安装 了 Python。 为 此 , 打开 “ 开 
人 ”菜单 并 选择 “所 有 程序 ”， 将 看 到 一 个 与 
Python 3.0 相关 的 选项 ( 其 背景 通常 为 黄色 )。 
选择 其 中 的 选项 IDLE (Python GUD, 一 段 时 
间 后 程序 IDLE 将 启动 ， 如 图 1-2 所 示 。 


6. 输入 24*7 并 按 回 车 ， 应 出 现 数字 168。 


Tx python Shell 


Ele Edt Shel Debug Options Windows Hep 
oh 19 2008, 14:56:09) [NSC v.1500 32 bit (Intel)] on win: 
"license() ”for more information。 


IDLE 3.0bl 
>>> 


1-2 
当前 使 
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IDLE 编辑 器 的 起 始 屏 幕 。 第 一 行 指出 了 
的 是 哪个 Python 版 本 ( 这 里 


1.4.2 在 Mac 系统 上 安装 Python 加 
OS X 自 带 并 安装 了 一 个 Python 版 本 , 但 

该 版 本 没有 IDLE 编辑 器 ， 通 篆 也 不 是 最 新 版 

本 。 要 安装 更 新 的 Python 版 本 ， 可 按 www. 

python.org/download/mac/ 给 出 的 说 明 人 做， 也 

可 从 www.pythonmac.org/packages/ 下 载 一 个 

安装 程序 并 运行 它 。 下 载 安 装 程序 时 ， 务 必 

选择 正确 的 Python 版 本 (3.0 或 更 高 版 本 )， 

并 确保 Mac OS 版 本 号 与 你 的 操作 系统 版 本 号 

一 致 。 


1.4.3 在 Linux 系统 上 安装 Python 

如 果 你 使 用 的 是 Linux， 很 可 能 已 经 安装 
了 了 Python。 要 确认 这 一 点 ， 可 打开 命令 行 窗 
口 并 输入 python， 如 果 输 出 与 图 1-2 类 似 , 说 
明 Python 运行 正常 。 


务必 检查 版 本 号 。 本 书 介绍 的 是 Python 3， 
如 果 当 前 安装 的 是 Python 2.x 或 更 早 的 版 本 ， 
就 应 安装 Python 3。 


具体 如 何 安装 因 Linux 系统 而 异 。 例 如 ， 
在 Ubuntu Linux 系统 上 ， 需 要 在 Synaptic 
Package Manager 中 搜索 Python。 你 也 可 以 
访问 www.python.org/download， 了 解 如 何在 
Linux 系统 上 安装 Python。 


人 关注 


1.4 人 魏 农 Python 2 
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算术 、 字 人 稚 串 与 变量 


要 学 习 编 程 ， 首 先 要 了 解 基 本 的 Python 
数据 类 型 : 整 型 ( 整数 )、 浮 点 数 (高 小数点 
的 数字 ) 和 字符 串 。 所 有 程序 都 使 用 这 些 ( 及 
其 他 ) 数据 类 型 ， 因 此 牢固 掌握 它们 的 用 法 
至 关 重 要 。 


使 用 字符 串 的 程序 如 此 之 多 ， 所 以 
Python 提供 了 强大 的 字符 串 支 持 。 本 章 将 介 
绍 字符 串 的 基本 知识 ， 而 第 6 章 还 将 回 过 头 
来 更 深入 地 介绍 。 

我 们 还 将 介绍 最 重要 的 编程 概念 一 一 交 
量 。 变 量 用 于 存储 和 操作 数据 ， 如 果 不 使 用 
儿 个 变量 ,就 很 难 编写 出 有 用 的 程序 。 


与 学 习 弹 钢琴 或 说 外 语 一 样 ， 学 习 编 程 
的 最 佳 方式 也 是 多 练 。 因 此 ， 本 章 将 利用 交 
互 式 命令 shell (IDLE ) 来 介绍 上 述 所 有 知识 ， 
你 最 好 跟着 做 : 在 计算 机 上 输入 书 里 介绍 的 
示例 。 


本 章 内 容 

口 交互 式 命令 shell 
口 整数 算术 

口 浮 点 数 算术 

口 其 他 数学 函数 
口 字符 串 

口 字符 串 拼接 

口 获取 帮助 

口 类 型 转换 

口 变量 和 值 

口 赋值 语句 

口 变量 如 何 引 用 值 
口 多 重 赋值 


2.1 交互 式 命令 shell 


我 们 来 看 看 如 何 与 Python shell 交互 。 首 
先 ， 启动 IDLE。 在 Windows 系统 中 ， 它 位 于 
“开始 ”菜单 的 程序 列表 中 ; 在 Mac 或 Linux 
系统 中 ， 可 直接 在 命令 行 输入 python 来 启动 
它 。 这 将 打开 Python 交互 式 命令 shell， 它 类 
似 于 图 2-1。 


2.1.1 shell 提示 符 


在 Python 记录 中 ，>>> 是 Python shell 提 
示 符 。>>> 表示 当前 行 是 你 (用户 ) 的 输入 ， 
而 没有 >>> 的 行 是 Python 生成 的 。 因 此 ， 一 
眼 就 能 分 辨 出 哪些 内 容 来 自 Python， 哪 些 内 
容 来 自用 户 。 


2.1.2 ”记录 

shell 记录 是 命令 行 shell 的 快照 ， 显 示 了 
一 系列 用 户 输 入 和 Python 的 应 答 。 我 们 将 频 
繁 使 用 shell 记录 。 它 们 让 你 能 够 查看 实际 示 
例 的 运行 情况 ， 这 是 学 习 Python 的 绝 佳 方式 。 


术语 说 明 


shell 


交互 


交互 式 命令 shell 常 简称 为 交互 式 
、 命 令 shell、shell 甚至 命令 行 。 


shell 记录 (transcript ) 有 时 称 为 记录 、 
式 会 话 ( session ) 或 会 话 。 


>>> 


Python 3.3.0 (v3.3.0:bd8afb9oebf2，Sep 29 2012, 10:55:48) [MSC v.1600 32 bit (Intel)] on win32 
Type "copyright", "credits" or "license()" for more information. 


图 2-1 刚 启动 Python 交互 式 命令 shell 时 看 到 的 内 容 。 


头 T 


而 行 指出 了 你 运行 的 是 哪个 Python 版 本 。 这 


里 的 信息 表明 ， 运 行 的 是 Python 3.3.0， 它 是 2012 年 9 月 29 日 上 午 11 点 之 前 的 几 分 钟 创建 的 
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2.2 ”整数 算术 

整数 是 不 带 小 数 部 分 的 数字 ， 如 25、-86 
和 0。Python 支持 4 种 基本 算术 运算 :+ ( 加)、 
一 ( 减 ) *( 乘 ) 和 / (| 除 )。Python 还 使 用 ** 
和 % 来 分 别 表示 科 方 和 求 余 ， 例 如 ，25 % 7 
的 值 为 4， 因 为 25 除 以 7 的 余数 为 4。 下 面 
是 一 些 示例 。 


>>% 5 9 

14 

>>> 22 - 6 

16 

> 12 14 

168 

>>> 22 / 7 
3.1428571428571428 
33 之 小 

16 

>>> 25 % 7 

4 
>>>1+2*3 

7 

>>> (1 + 2) * 3 


9 


2.2.1 整除 


Python 还 有 一 个 整除 运算 符 /， 其 工作 
原理 类 似 于 /， 但 结果 总 是 整数 。 例 如 ，7 // 3 
的 结果 为 2 一 一 将 小 数 点 后 面 的 值 丢 弃 ( 而 不 
是 四 舍 五 人 )。 


2.2 ”整数 算术 11 
图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


2.2.2 ” 求 值 顺序 表 2-1 基本 算术 运算 符 


表 2-1 总 结 了 Python 的 基本 算术 运算 符 ， 人 
并 按 优先 级 从 低 到 高 的 顺序 将 它们 编组 。 例 
如 ， 计 算 表达 式 1 + 2 * 3，Python 先 执行 * ， ee _ a 
再 执行 +， 因 为 * 的 优先 级 更 高 ( 因此 ， 这 ; 
个 表达 式 的 值 为 7， 而 不 是 9)。 优先 级 相同 乘法 * >>>2*3 
的 运算 符 按 书写 顺序 计算 。 要 改变 计算 顺序 ， 6 
可 使 用 圆 括号 ()， 例 如 ，(1 + 2) * 3 的 结果 为 Be | 
9。 换 名 话说，Python 算术 运算 的 规则 与 常规 ee a 
算术 运算 相同 。 | 
求 余 % >>> 25%3 
2.2.3 ”长 度 不 受 限制 ee 
与 其 他 大 多 数 编程 语言 不 同 ，Python 对 


整数 的 长 度 没 有 限制 ， 你 可 以 执行 数 十 位 其 
至 数 百 数 千 位 的 整数 运算 。 


>>> 27 ** 100 


136891479058588375991326027382088315 
”966463695625337436471480190078368 
”997177499076593800206155688941388 
” 250484440597994042813512732765695 
”774566001 
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2.3 浮 点 数 算术 >>> 3.8 + -43.2 


-39.400000000000006 
ee 点 数 。 在 >>> 12.6 * 0.5 

Python 中 ， 浮 点 数 是 带 小 数 点 的 数字 ， 例 如 ， 3 

a >>> 12.6 + 0.01 

-3.1 、2.999 和 -4.0 都 是 浮 点 数 。 12.61 


>>> 365.0 / 12 


所 有 适用 于 整数 的 算术 运算 都 可 用 于 浮 30.416666666666668 
点 数 ， 包 括 % ( 求 余 ) 和 / (整除 )。 图 2-2 >>> 8B.8 -5.4 


一 < 一 7.939507629591553e-06 
显示 了 一 些 示 例 。 


>>> 5.6 // 2 
之 > 全 
>>> 5.6 % 3.2 
: 辽 上 扣 兴 必 时 
2.3.1 浮 点 数字 面 量 2.3999999999999995 
对 于 非常 大 或 非常 小 的 浮 点 数 ， 通 常用 - - - 
科学 记 数 法 表示 2-2 些 使 用 Python 命令 shell 执行 基本 浮 点 


数 算术 运算 的 示例 。 请 注意 ， 近 似 误差 很 常见 ， 
>>> 8.8 ** -5.4 此 显示 的 通常 不 是 准确 值 


7.939507629591553e-06 


e-06 表示 将 它 前 面 的 数字 乘 以 10“。 如 
果 愿 意 ， 你 可 以 直接 使 用 科学 记 数 法 。 


>>> 2.3e02 


230.0 
在 使 用 小 数 点 方面 ，Python 非常 灵活 。 


>>> 3. 
3.0 
>>> 3.0 


3.0: 
对 于 类 似 于 0.5 的 数字 , 书写 时 可 以 包含 一 
前 导 零 ， 也 可 以 不 包含 。 通常 5.0 比 5. 更 清晰 ， 因 为 后 者 可 能 
令 人 迷惑 ， 它 看 起 来 像 句 子 结尾 。 


Fy 

3 SEE 区 分 5 和 5.0 很 重要 ， 因 为 5 是 整数 ， 
M0 而 5.0 是 浮 点 数 ， 它 们 的 内 部 表示 大 相 径 庭 。 
0.5 EAE 
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2.3.2 溢出 

与 整数 不 同 ， 浮 点 数 存在 上 限 和 下 限 ， 
超出 上 限 或 下 限 将 导致 溢出 错误 。 洲 出 错误 
意味 着 计算 结果 太 大 或 太 小 ，Python 无 法 将 
其 表示 为 浮 点 数 ， 如 图 2-3 所 示 。 面 对 溢出 
错误 ，Python 可 能 沉默 不 语 ， 即 继续 执行 错 
误 的 计算 ， 而 不 告诉 你 出 了 问题 。 一 般 而 言 ， 
避免 浴 出 错误 的 职责 由 程序 员 承 担 。 


2.3.3 ”精度 有 限 

无 论 在 哪 种 计算 机 上 ， 浮 点 数 的 精度 都 
是 一 个 无 法 解决 的 难题 。 在 计算 机 中 ， 数 字 
用 二 进 制 ( 基数 为 2 ) 表示 ， 但 并 非 所 有 浮 点 
数 都 可 用 二 进 制 精确 地 表示 。 即 便 在 最 简单 
的 情况 下 ， 也 可 能 出 现 问题 ， 比 如 下 例 。 


>>>1-2/3 


0.33333333333333337 

结果 应 该 是 小 数 点 后 面 有 无 穷 个 3， 但 这 
里 只 包含 17 位 。 另 外 ， 最 后 一 位 也 不 对 一 一 
应 该 是 3 而 不 是 7。 


>>> 500.0 ** 10000 
Traceback (most recent call last): 
File "<pyshell#7>", line 1, in <module> 
500.0 ** 10000 
OverflowError: (34, "Result too large') 


2-3” 浮 点 数 溢 出 : 500.0 ** 10000 的 结果 太 大 ， 
无 法 存储 为 浮 点 数 
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这 些 细 微 的 误差 通常 不 是 问题 ， 对 大 多 
数 程序 来 说 ， 小 数 点 后 面包 含 17 位 足够 了 。 
然而 ， 当 你 执行 大 量 计算 时 ， 小 误差 会 累积 
出 大 误差 。 例 如 ,计算 新 设计 的 桥梁 承受 的 
压力 时 ， 必 须 考 虑 细微 的 浮 点 数 误 差 ， 避免 
它们 累积 出 大 误差 。 


是 浮 点 数 ， 因 为 它们 更 精确 且 绝 不 会 溢出 。 


2.3.4 复数 


Python 提供 了 内 置 的 复数 支持 。 复 数 是 
涉及 -1 的 平方 根 的 数字 , 在 Python 中 , 用 了 
表示 -1 的 平方 根 。 


>>> 1j 
1j 
| 


(-1+0j) 


在 有 些 工 程 和 科学 计算 中 ,复数 很 有 用 ， 
但 本 书 不 会 再 使 用 它们 。 
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2.4 其 他 数学 函数 


Python 自 带 了 很 多 由 编写 好 的 代码 组 成 
的 模块 ，math 就 是 其 中 之 一 。 表 2-2 列 出 了 
math 模块 中 一 些 最 常用 的 函数 。 


这 些 函 数 返回 一 个 值 ， 这 意味 着 它们 的 
结果 为 整数 或 浮 点 数 ， 具 体 随 函 数 而 异 。 


在 可 以 使 用 数字 的 任何 地 方 ， 都 可 使 用 
这 些 冰 数 。Python 自动 执行 函数 ， 并 将 函数 
调用 替换 为 返回 值 。 


2.4.2 导入 模块 

要 使 用 模块 math 或 其 他 任何 Python 模 块 ， 
都 必须 先导 入 : 

>>> import math 

这 样 就 可 以 访问 任何 数学 函数 了 ， 方 法 
是 在 函数 前 面 加 上 math.。 


>>> math.sqrt(5) 


2.2360679774997898 
>>> math.sqrt(2) * math.tan(22) 
0.012518132023611912 


下 面 是 男 一 种 导入 模块 的 方式 。 


>>> from math import * 


这 样 调用 math 模块 中 的 任何 函数 时 ， 都 
无 需 在 前 面 加 上 math.。 


>>> log(25 + 5) 
3.4011973816621555 

>>> sqrt(4) * sqrt(10 * 10) 
20.0 


表 2-2 模块 math 中 的 一 些 函数 
函 数 描 述 
ceil(x) 大 于 或 等 于 x 的 整数 
cos(x) x 的 余弦 
degrees(x) 将 x 弧度 转换 为 度数 
exp(x) e 的 x 次 方 
factorial(n) 计算 n 的 阶乘 (n!), n! = 1*2*3…*n， 
其 中 必须 是 整数 
log(x) 外 e 为 底 的 x 的 对 数 
log(x, b) 义 5 为 底 的 x 的 对 数 
pow(x, y) XxX 的 y 次 方 
radians(x) 将 x 度 转 换 为 弧度 数 
sin(x) x 的 正弦 
sqrt(x) x 的 平方 根 
tan(X) x 的 正切 


使 用 导入 方式 from math import* 时 ， 
如 果 函 数 与 math 模块 中 的 菜 个 函数 同名 ,将 
被 math 模块 中 的 同名 函数 履 盖 。 


因此 ， 使 用 导入 方式 import math 通 
常 更 安全 ， 因 为 它 不 会 覆盖 任何 婚 有 函数 。 


6 你 还 可 导入 模块 math 的 特定 
例如 ，from math import sqrt，tan 只 
数 sqrt 和 tan。 
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2.5 ”字符 串 

字符 串 是 一 系列 字符 ， 如 "cat!"、"567- 
45442" 和 "Up and Down" .字符 包 括 字 母 数字、 
标点 符号 以 及 数 百 个 其 他 的 特殊 符号 和 不 可 
打印 的 字符 。 


2.5.1 标识 字符 串 

在 Python 中 ， 可 使 用 下 列 3 种 主要 方式 
来 表示 字符 串 字 面 量 。 

口 单 引 号 ， 如 'http'、'openhouse' 或 


Gat 


口 双 引号 ， 如 "http"、"open house" 或 


Cat 。 


口 三 引号 , 如 """http""" 或 多 行 字符 串 : 


Me and my monkey 


Have something to hide 


很 多 Python 程序 员 更 喜欢 使 用 单 引 
号 来 标识 字符 串 ， 这 仅仅 是 因为 输入 量 比 使 
用 双 引 号 少 (不 需要 按 住 Shift 键 )。 


单 引 号 和 双 引 号 的 一 个 主要 用 途 是 ， 
让 你 能 够 在 字符 囊 中 包含 字符 " 和 '。 
"It's great" 


"She said "Yesl 
在 需要 创建 多 行 的 长 字符 串 时 ， 三 
引号 很 有 用 。 在 使 用 三 引号 括 起 的 字符 事 中 ， 如 果 在 字符 串 中 包含 错误 类 型 的 引 
还 可 包含 字符 " 和 '。 号 ， 将 导致 错误 。 
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2.5.2 ”字符 串 的 长 度 


要 确定 字符 串 包含 多 少 个 字符 ， 可 使 用 
图 数 len(s)， 如 下 所 示 。 


>>> len('pear') 

4 

>>> len('up, up, and away') 
16 

>>> len("moose") 

5 

>>> len("") 


0 

最 后 一 个 示例 使 用 了 空 字 符 串 。 空 字符 
串通 常 表示 为 '' 或 "", 没有 包含 任何 字符 。 

由 于 函数 len 返回 一 个 整数 ， 所 以 在 任 


何 可 以 使 用 整数 的 地 方 ， 都 可 使 用 函数 len， 
例如 : 


>>> 5 + len('cat') * len('dog') 
14 
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2.6 字符 串 拼 接 
可 以 将 既 有 字符 串 “ 相 加 ”来 创建 新 的 
字符 串 ， 比 如 : 


>>> "hot ' + “dog 

"hot dog 

>>> Once" + " "+ "Upon + ”十 
» "a Time" 


"Once Upon a Time' 
这 种 运算 被 称 为 拼接 。 


要 将 同一 个 字符 串 拼接 很 多 次 ， 可 使 用 
下 面 这 种 整洁 的 快捷 方式 。 


>>> 10 * “ha' 
"hahahahahahahahahaha” 
>>> 'hee' * 3 
‘heeheehee" 

>>> 3 * "hee” + 2* "1" 


"heeheeheel 


字符 冲 拼 接 的 结果 为 另 一 个 字符 串 ， 因 
此 可 在 任何 需要 字符 串 的 地 方 使 用 字符 串 拼 
接 。 


>>> len(12 * “pizza piel ) 
120 
>>> len("house" + "boat ' ) * "12， 


"121212121212121212" 
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2.7 ”获取 帮助 


从 很 大 程度 上 说 ，Python 是 一 种 自 文档 
化 语言 ， 大 多 数 函 数 和 模块 都 包含 简短 的 解 
释 ， 你 无 需求 助 于 图 书 或 网 站 就 能 搞 明 白 如 
何 使 用 它们 。 


2.7.1 列 出 模块 中 的 函数 


导入 模块 后 ， 可 使 用 函数 dir(m) 列 出 模 
块 的 所 有 函数 。 


>>> import math 
>>> dir(math) 


[ ”doc ',' name '， 


"'_ package ', 'acos', 'acosh', 
'asin', 'asinh', 'atan', 'atan2', 
'atanh', 'ceil', 'copysign’', 
'cos', 'cosh', 'degrees', 'e', 
'exp', "fabs'， 'factorial', 
'floor', 'fmod', 'frexp', 'hypot', 
'isinf', 'isnan', 'ldexp', 'log', 
'log10', 'log1p', 'modf', 'pi', 

” 'pow', 'radians', 'sin', 'sinh', 
'sqrt', 'sum', 'tan'’, 'tanh’, 
'trunc'] 


这 让 你 对 模块 包含 的 函数 有 了 了 大任 的 了 
解 ， 很 多 Python 程序 员 经 常 使 用 dir(m)。 
就 现在 而 言 ， 不 用 考虑 以 双 下 划 线 (__) 


打头 的 名 称 ， 因 为 它们 只 用 于 较 复 杂 的 Python 
编程 。 
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SEE 妥 查 看 完整 的 Python 内 置 函 数 清单 ， 
可 在 命令 提示 符 下 输入 dir(_、builtins_ )。 


辆 园 ”人 还 可 使 用 函数 help(f) 来 查看 函数 
f 的 文档 字符 串 。 


IE 妥 运 行 Python 实用 程序 help， 可 在 
提示 符 下 输入 help()。 这 将 向 你 显示 各 种 有 
用 的 信息 ， 如 完整 的 模块 清单 、 有 关 函 数 和 
关键 字 的 帮助 信息 ， 等 等 。 


你 还 可 从 Python 文档 (www.python. 
org/doc/ ) 获取 帮助 。 在 这 里 ， 可 找到 实用 教 
程 以 及 Python 语言 和 标准 模块 的 详情 。 


2.7.2 打印 文档 字符 串 
另 一 个 实用 技巧 是 打印 函数 的 文档 字符 串 。 


>>> print(math.tanh. doc ) 
tanh(x) 
Return the hyperbolic tangent of x. 


大 多 数 Python 内 置 函 数 都 有 人 简短 的 文档 
字符 串 ，Python 标准 模块 ( 如 math ) 中 的 大 
部 分 函数 亦 如 此 ; 你 可 使 用 前 述 方式 来 访问 
这 些 文档 字符 串 。 


再 来 看 一 个 例子 ， 下 面 是 内 置 函数 bin 
的 文档 字符 串 。 


>>> print(bin. doc ) 
bin(number) -> string 


Return the binary representation of 
”an integer or long integer. 


>>> bin(25) 
'0b11001" 


2.7 获取 帮助 21 
图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


2.8 ”类 型 转换 


类 型 转换 是 一 种 常见 任务 ，Python 提供 


了 很 多 简化 这 种 工作 的 内 置 函 数 。 


2.8.1 将 整数 和 字符 串 转换 为 浮 点 数 


要 将 整数 3 转换 为 浮 点 数 ， 可 使 用 函数 
float(x)。 


>>> float(3) 
3::0 
将 字符 串 转 换 为 浮 点 数 的 方式 与 此 类 似 。 


>>> float('3.2') 
3.2000000000000002 
>>> float('3') 


3.0 


2.8.2 将 整数 和 浮 点 数 转 换 为 字符 串 
函数 str(n) 将 指定 的 数字 转换 为 相应 的 
字符 串 。 


>>> str(85) 
485， 

>>> str(-9.78) 
'-9.78" 


隐 式 转换 

有 时 候 Python 会 自动 在 数值 类 型 之 间 
转换 ， 而 不 要 求 你 显 式 地 调用 转换 函数 ， 
例如 : 


>>>250 5 


区 


这 里 自动 将 25 转换 为 23.0， 再 将 其 与 
8.5 相 乘 。 一 般 而 言 ， 表 达 式 同时 包含 整数 
和 浮 点 数 时 ，Python 会 自动 将 整数 转换 为 
浮 点 数 。 
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圆 整 

在 Python 中 , round(8.5) 的 结果 为 8 
而 不 是 9， 对 此 很 多 人 都 感到 惊讶 。 你 在 
小 学 可 能 学 过 ， 对 于 小 数 部 分 为 .5 的 数字 ， 
总 是 应 该 向 上 圆 整 的 。 


然而 ， 总 是 向 上 圆 整 带 来 的 偏差 可 能 
导致 计算 不 准确 ， 因 此 了 Python 采用 了 另 一 
种 圆 整 策略 : 将 小 数 部 分 为 .5 的 数字 国 整 
到 最 接近 的 偶数 ( 有 时 被 称 为 银行 家 圆 整 )， 
因此 ， 小 数 部 分 为 .5 的 数字 可 能 向 下 国 整 ， 
也 可 能 向 上 圆 整 。 


年 一 看 ， 这 种 策略 有 点 奇怪 ， 也 不 同 
于 Python 2 的 圆 整 方式 。 然 而 ， 这 是 在 
计算 机 上 圆 整 数字 的 标准 方式 ， 为 大 家 普 
遍 接 受 。 如 果 你 想 了 解 其 中 的 细节 ， 请 参 
阅 维基 百科 的 相关 词 条 ， 其 网 址 为 http:// 
en.wikipedia.org/wiki/Rounding。 


2.8.3 ”将 浮 点 数 转 换 为 整数 

这 有 点 棘手 ， 因 为 你 必须 决定 如 何 处 理 
浮 点 数 的 小 数 部 分 。 函 数 int(x) 将 小 数 部 分 
删除 ， 而 round(x) 采用 如 下 标准 圆 整 方式 。 


>>> int(8.64) 

8 

>>> round(8.64) 
9 

>>> round(8.5) 
8 


2.8.4 将 字符 串 转 换 为 数字 
这 很 容易 ， 只 需 使 用 水 数 int(s) 或 
float(s) 即 可 。 


>>> int('5') 

5 

>>> float('5.1') 
5 了 


ER 对 于 大 多 数 应 用 程序 ， 使 用 int(x)、 
float(x) 和 round(x) 就 能 满足 数值 转换 需 
求 。 然 而 ， 为 处 理 更 具体 的 转换 ，Python 
模块 math 提供 了 很 多 将 小 数 部 分 删除 的 函 
数 : math.trunc(x)、math.ceil(x) 和 math. 
floor(x)。 


函数 int(s) 和 float(s) 将 字符 串 转 
换 为 浮 点 数 / 整 数 ， 它 们 假定 字符 串 看 起 来 像 
Python 浮 点 数 /整数 ， 如 果 不 是 这 样 ， 将 出 现 
一 条 错误 消息 ， 指 出 不 能 执行 转换 。 
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2.9 变量 和 值 


变量 是 最 重要 的 编程 概念 之 一 。 在 
Python 中 ， 变 量 标记 (1label ) 或 指向 一 个 值 。 


例如 : 


>>> fruit = "cherry" 
>>> fruit 


'cherry’ 


其 中 ，fruit 是 一 个 变量 名 ， 它 指向 字符 
串 值 "cherry"。 请 注意 ， 变 量 名 无 需 用 引号 
括 起 。 


代码 行 fruit = "cherry" 被 称 为 赋值 语 
句 ; = (等 号 ) 被 称 为 赋值 运算 符 ， 用 于 让 变 
量 指向 一 个 值 。 


遇 到 变量 时 ，Python 将 其 蔡 换 为 指向 的 
值 ， 因 此 : 


>>> cost = 2.99 

>3% 0 * Cost 
0.29900000000000004 
>>> 1.06 * cost + 5.99 


9.1594000000000015 


术语 说 明 
与 变量 一 样 ， 函 数 、 模 块 和 类 也 都 有 
名 称 。 我们 将 这 些 名 称 统称 为 标识 符 。 
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表 2-3 合法 和 非法 的 变量 名 变量 命名 规则 
法 变量 名 非法 变量 名 开明 


变量 名 必须 遵守 下 面 几 条 基本 规则 ( 表 
。 了 2-3 提供 了 一 些 示例 )。 

en 0 变量 名 的 长 度 不 受 限 制 ， 但 其 中 的 字 
ee e we el 数字 或 下 划 线 (_), 


不 能 使 用 空格 、 连 字符 、 标 点 符号 、 
引号 或 其 他 字符 。 


>>> else = 25 口 变量 名 的 第 一 个 字符 不 能 是 数字 ， 而 
SyntaxError: invalid syntax 必须 是 字母 或 下 划 线 。 


2-4 ”else 是 Python 关键 字 ， 不 能 用 作 变 和 


四 由 
Ey 


口 Python 区 分 大 小 写 ， 因 此 TAX、Tax 和 
tax 是 截然 不 同 的 变量 


口 不 能 将 Python 关键 字 用 作 变 量 名 。 例 
0, if、 else、 while、 def、or、and、 
not 、in 和 is 都 是 Python 关键 字 ( 本 
书后 面 将 介绍 它们 的 用 途 )， 试 图 将 它 
们 用 作 变 量 名 将 导致 错误 ， 如 图 2-4 
所 示 。 
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2.10 赋值 语句 


赋值 语句 包含 3 个 主要 部 分 : 左 值 、 赋 


值 运算 符 和 右 值 ， 如 图 2-5 所 示 。 


赋值 语句 有 两 个 用 途 : 定义 新 的 变量 ; 
让 已 定义 的 变量 指向 特定 值 。 例 如 : 


> X=.5 
>>>2*x+1 
41 


>>> x = 99 


条 赋值 语句 ( x =5 ) 完 成 了 两 项 职责 ， 
是 一 条 pe 它 让 Python 创建 新 变量 
x， 并 将 值 5 赋 给 它 。 然 后 ， 在 可 以 使 用 整数 
的 任何 地 方 ， 都 可 使 用 变量 x 了 。 


第 二 条 赋值 语句 (x = 99 ) 给 x 重新 赋值 ， 
让 它 指向 另 一 个 值 。 它 没有 创建 变量 x， 因 为 
这 个 变量 已 经 存在 ， 这 是 前 一 条 赋值 语句 的 
es 


如 果 你 不 对 变量 初始 化 ，Python 将 报错 : 


>>>2*y+1 
Traceback (most recent call last): 
File "<pyshell#6>", line 1, in <module> 
2*y+1 


NameError: name 'y' is not defined 


左 值 (LHS) 右 值 (RHS) 
Var = Value 


2-5 ”赋值 语句 剖析 。 这 条 语句 让 var 指 向 


value。 左 值 必须 是 变量 ， 而 右 值 可 以 是 变量 


目 


或 结果 为 值 的 任何 表达 式 


值 
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术语 说 明 
常用 于 描述 变量 和 值 的 术语 很 多 。 我 
们 有 时 候 说 将 值 赋 给 变量 或 给 变量 指定 值 。 


对 于 已 经 赋值 的 变量 ， 说 它 指 向 、 标 
记 或 拥有 相应 的 值 。 
程序 员 有 时 说 变量 包含 其 值 ， 好 像 变 


量 是 桶 ,而 值 在 桶 内 。 这 种 说 法 的 问题 在 于 ， 
Python 变量 并 不 符合 你 以 为 的 “包含 "模型 。 
例如 ， 在 Python 中 ， 同 一 个 对 象 不 能 同时 
出 现在 多 个 桶 内 ， 但 可 以 有 多 个 变量 同时 
指向 它 。 


上 述 错 误 消 息 指 出 变量 y 未 定义 ， 因 此 
Python 不 知道 该 使 用 什么 值 来 蔡 换 表达 式 2 * 
y+ 1 中 的 y。 


可 以 将 任何 值 赋 给 变量 ， 包 括 其 他 变量 
的 值 。 请 看 下 面 的 一 系列 赋值 语句 : 


>>> X = 5 
>>> X 

5 

>>> y= 'cat’ 
>>> y 

"cat 

>>> X = y 
>>> X 

"cat 

>>> y 


"cat 
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2.11 变量 如 何 引 用 值 


对 于 x = expr 这 样 的 Python 赋值 语句 ， 
可 以 这 样 解读 : 让 Xx 指向 表达 式 expr 的 值 。 


别 忘 了 ，expr 可 以 是 任何 结果 为 值 的 
Python 表达 式 o 


为 帮助 理解 一 系列 赋值 语句 ， 一 种 不 错 
的 方式 是 绘制 示意 图 。 例 如 ， 执 行 语句 rate 
= 0.04 后， 可 以 认为 计算 机 的 内 存 类 似 于 
2-6 所 示 。 接 下 来 ， 执 行 语句 rate_2008 = 
0.06 后 ,计算 机 内 存 类 似 于 图 2-7 所 示 。 最 后 ， 
执行 语句 rate = rate 2008 后 ， 计 算 机 内 存 
类 似 于 图 2-8 所 示 。 


对 于 没有 任何 变量 指向 的 值 ( 例如， 图 
2-8 中 的 0.04 )，Python 自动 将 其 删除 。 一 般 
而 言 ，Python 跟踪 所 有 的 值 ， 并 自动 删除 不 
再 有 变量 指向 的 值 。 这 称 为 垃圾 收集 ， 因 此 
Python 程序 员 很 少 需要 为 删除 值 操心 。 


2.11.1 赋值 时 不 复制 

你 必须 明白 ， 赋 值 语句 并 不 会 复制 指向 
的 值 ， 而 只 是 标记 和 重新 标记 既 有 值 。 因 此 ， 
无 论 变量 指向 的 对 象 有 多 大 、 多 复杂 ， 赋 值 
语句 的 效率 都 非常 高 。 


2.11.2 ”数字 和 字符 串 是 不 可 变 的 

在 Python 中 ， 数 字 和 字符 串 的 一 个 重 
要 特征 是 不 可 变 ， 即 不 能 以 任何 方式 修改 它 
们 。 在 看 起 来 是 修改 数字 或 字符 串 的 情况 下 ， 
Python 实际 上 是 在 创建 修改 版 本 的 拷贝 ， 如 
图 2-9 所 示 。 


rate 


lL 


0.04 


2-6 ”执行 语句 statement rate = 0.04 后 


rate rate 2008 
0.04 0.06 


2-7 ”执行 语句 Tate_ 2008 = 0.06 后 


rate rate 2008 
0.04 0.06 


2-8 ”执行 语句 rate = rate 2008 后 。 注 意 , 不 
再 有 变量 指向 0.04 了 ， 因 此 Python 自动 将 其 删除 ， 
这 个 过 程 称 为 垃圾 收集 


>>> s = "apple 

>>> s+'s' 

'apples' 

>>>s 

'apple’ 

>»>> 5= 1 

SyntaxError: can't assign to literal 


图 2-9 在 看 起 来 是 修改 字符 串 的 情况 下 ，Python 
实际 上 是 在 创建 拷贝 。 在 Python 中 ， 根 本 不 可 能 
修改 数字 和 字符 串 
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2.12 多重 赋值 


在 Python 中 ， 有 一 种 便利 的 技巧 ， 让 你 
能 够 同时 给 多 个 变量 赋值 : 


>>> x, y, z = 1， 'two', 3.0 


>>> Xx 


3.0 
>>> x, y, Zz 


(1,'two', 3.0) 

正如 最 后 一 条 语句 演示 的 ， 还 可 以 在 一 
行 显示 多 个 值 ， 方 法 是 将 它们 作为 元 组 。 元 
组 总 是 以 左 圆 括号 (开始 ,以 右 圆 括号 ) 结 


2.12 多重 赋值 29 
图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


交换 变量 的 值 


个 


多 重 赋值 的 一 个 很 实用 的 用 途 是 交换 两 


变量 的 值 : 


> a 也 启 - 瑟 沿 
>>> a, b 

(5, 9) 

>>> ab = b,a 
>>> a, b 


(9, 5) 


语句 ab = b，a 的 含义 是 ， 同 时 给 变量 


a 和 bp 赋值。 如 果 不 使 用 多 重 赋值 ， 将 两 个 变 
量 的 值 互 换 的 标准 方式 如 下 : 


>>> a, b= 5，9 
>>> temp = a 
>>> a=b 

>>> b = temp 
>>> a, b 


(9, 5) 


多 重 赋值 的 功能 并 不 比 常规 赋值 多 ， 它 


只 是 一 种 偶尔 使 用 的 比较 便利 的 快捷 方式 。 


号 
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编 与 程序 


当 目 前 为 止 , 我 们 编写 的 都 是 单行 
Python 语句 ， 并 通过 交互 式 命令 行 运行 它们 。 
这 对 于 学 习 Python 函数 虽然 很 有 用 ， 但 当 需 
要 编写 大 量 Python 代码 行 时 ， 就 很 烦 玉 了 。 


因此 ， 现 在 开始 转 而 编写 程序 (也 叫 脚 
本 )。 程序 不 过 是 文本 文件 ， 但 包含 一 系列 
Python 命令 。 当 你 运行 (或 执行 ) 程序 时 ， 
Python 依次 执行 文件 中 的 每 条 语句 。 


在 本 章 中 ， 你 将 学 习 如 何在 IDLE 中 编写 
程序 ， 以 及 如 何 从 IDLE 和 命令 行 运行 程序 。 
你 将 明白 如 何 获取 用 户 通过 键盘 提供 的 输入 
以 及 如 何 将 字符 串 打印 到 屏幕 上 。 


你 应 该 尽力 亲手 输入 代码 ， 因 为 这 是 熟 
悉 各 种 Python 编程 规则 的 最 佳 方式 。 对 于 较 
大 的 程序 ， 可 从 本 书 的 配套 网 站 下 载 代码 ， 
网 址 为 http://pythonintro.googlecode.com。 


本 章 内 容 

口 使 用 IDLE 的 编辑 器 
口 编译 源 代码 

口 从 键盘 读 取 字 符 串 
在 屏幕 上 打印 字符 串 
口 源 代 码 注释 


口 程序 的 组 织 


0 


命 令 作 用 
IDLE 自 带 了 一 个 明白 Python 的 文本 编 CULN 打开 一 个 新 的 编辑 器 窗口 
辑 器 。 要 学 习 这 个 编辑 器 ， 最 住 的 方式 是 编 Ctrl-O 打开 一 个 文件 进行 编辑 
一 个 简单 程序 。 Ctrl-S 保存 当前 程序 
F5 运行 当前 程序 
Ee cul-z 撤销 最 后 一 次 操作 
3.1.1 在 IDLE 中 编写 程序 Shift-Ctrl-Z 重 做 最 后 一 次 操作 


在 IDLE 中 编写 程序 的 步 又 如 下 。 
1. 启动 IDLE。 


2. 选择 菜单 File > New Window。 


3. 输入 下 面 的 代码 : 


print('Welcome to Python!') 


4. 选择 菜单 File > Save 将 程序 存盘 。 将 
其 存储 在 你 的 Python 程序 文件 夹 中 ， 并 命 
名 为 welcome.py; 末尾 的 .py 表明 这 是 一 
Python 文件 。 


5. 选择 菜单 Run > Run Module 运行 程序 。 


将 出 现 一 个 Python shell， 其 中 显示 了 
“Welcome to Python!” 。 


熟悉 IDLE 编辑 后 ， 你 可 能 想 使 用 表 3-1 你 必须 按 原样 输入 Python 程序 ， 一 

列 出 的 一 些 快捷 键 , 它 们 确实 能 提高 编辑 速度 。 i ey ey 哪怕 错 一 个 字符 ( 多 一 个 空格 、 
将 数字 1 错误 地 输入 为 字母 1)， 都 可 能 导致 

在 计算 机 桌面 上 创建 一 个 特殊 文件 ”错误 。 
夹 ， Eee 名 为 python， 用 于 存储 你 的 所 
有 Python 程序 。 不 要 将 它们 存储 到 Python 安 全 如 果 你 运行 程序 时 看 到 错误 消息 ， 请 
装 目录 中 ， 否 则 将 面临 无 意 间 履 盖 Python 核 返回 到 编辑 器 窗口 ， 并 逐 字 符 地 仔细 核对 程 
心 文件 的 风险 。 序 ， 确 保 输入 正确 。 
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其 他 编辑 器 

对 初学 者 来 说 ，IDLE 是 一 款 杰 出 的 本 
辑 器 ， 连 一 些 专业 人 员 都 经 常 使 用 它 
而 ， 如 果 你 不 喜欢 IDLE， 可 在 网 国 
programming editors( 编程 编辑 器 ) 进 行 搜索 ， 
你 将 得 到 大 量 的 建议 。 例 如 ， 在 Windows 
系统 上 ，Notepad++ 是 一 款 深 受 欢 迎 的 编程 
编辑 器 ， 而 且 是 免费 的 。 另 一 款 深 受 欢 迎 
的 编辑 器 是 Sublime Text， 它 有 Windows、 
Mac 和 Linux 版 本 ， 但 不 是 免费 的 。 


要 获悉 众多 其 他 建议 ， 请 参阅 http:/ 
wiki.python.org/moin/PythonEditors。 


3.1.2 ”从 命令 行 运 行程 序 


另 一 种 运行 Python 程序 的 常见 方式 是 ， 
从 命令 行 运行 。 例 如 ， 要 运行 welcome.py， 
可 以 打开 命令 行 窗 口 ， 并 执行 下 述 命令 : 


C:\> python welcome.py 
Welcome to Python! 


也 可 以 只 调用 Python， 而 不 指定 程序 
这 将 打开 交互 式 解释 器 的 缩 简 版 本 ， 但 依然 
很 有 用 。 


3.1.3 ”从 命令 行 
执行 如 下 命令 


调用 Python 


C:\> python 


Python 3.0b2 (r30b2:65106, Jul 18 2008， 
» 18:44:17) [MSC v.1500 32 bit (Intel)] 


” On win32 
Type "help", "copyright", "credits" or 
"license" for more information. 


>>> 


将 Python 脚本 作为 其 他 程序 的 一 部 分 进 
行 运行 时 ， 通 常 从 命令 行 调用 Python。 
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在 Windows 系统 中 ， 打 开 命 令 行 窗 
口 的 最 简单 方式 是 , 单 击 “ 开 始 ” 按 钮 ,在 “ 运 
行 ” 对 话 框 中 输入 cmd 并 按 回 车 键 。 这 将 打 
开 一 个 命令 行 窗口 。 


泗 国 左 Mac 和 Linux 系统 中 ， 从 命令 行 运 
行 Python 程序 的 方式 相 类 似 : 打开 命令 shell 
(具体 如 何 打开 随 系统 而 异 ， 但 你 可 通过 桌面 
上 的 菜单 浏览 可 用 的 程序 )， 再 输入 python 以 
及 要 运行 的 程序 的 名 称 。 


从 命令 行 运行 Python 时 ， 令 人 讨厌 
一 点 是 通常 需要 配置 环境 变量 ( 具体 地 说 
是 系统 的 路 径 变 量 )， 让 系统 知道 到 计算 机 的 
什么 地 方 去 寻找 Python。 关 于 具体 如 何 配 置 
的 介绍 过 于 烦琐 上 且 随 系统 而 异 ， 这 超出 了 本 
书 的 范围 。 然 而 ， 如 果 你 要 配置 ， 很 容易 在 
网 上 找到 详细 的 说 明 。 例 如 ， 只 需 在 喜欢 的 
搜索 引擎 中 输入 set windows path 即 可 。 修改 
环境 变量 时 务必 小 心 : 如 果 你 拿 不 准 该 如 何 
做 ,很 可 能 破坏 系统 ， 导 致 程序 再 不 能 正确 
运行 。 在 这 种 情况 下 ， 最 佳 的 选择 是 从 头 再 
来 并 重新 安装 Python。 


全 
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pizza.py 


本 和 


Python ! 解释 器 | | 编译 器 | 虚拟 机 


pizza.pyc 


3-1 Python 由 3 个 主要 部 分 组 成 : 运行 语句 的 
解释 器 、 将 .py 文件 转换 为 .pyc 文件 的 编译 器 以 及 
运行 .pyc 文件 的 虚拟 机 。 请 注意 ， 严 格 地 说 IDLE 
并 非 Python 的 一 部 分 ， 它 是 一 个 位 于 Python 之 上 
的 独立 应 用 程序 ， 旨 在 让 Python 使 用 起 来 更 容易 


3.2 编译 源 代 码 


我 们 经 常 将 Python 程序 中 的 语句 称 为 
源 代码 ， 并 将 程序 文件 称 为 源 代码 文件 。 根 
据 约 定 ， 所 有 Python 源 代码 文件 都 使 用 扩展 
名 .py。 这 让 人 和 程序 一 眼 就 能 明白 文件 包含 
Python 源 代 码 。 


目标 代码 

当 运 行 .py 文件 时 ，Python 会 自动 创建 相 
应 的 .pyc 文件 ， 如 图 3-1 所 示 。.pyc 文件 包 
含 目标 代码 ( 编译 后 的 代码 )。 目 标 代码 基本 
上 是 一 种 Python 专用 的 语言 ， 以 计算 机 能 
高 效 运行 的 方式 表示 Python 源 代码 。 这 种 代 
码 并 不 是 供 人 类 阅读 的 ， 因 此 在 大 多 数 情况 
下 你 都 应 对 .pyc 文件 置之不理 。 


Python 程序 是 使 用 名 为 虚拟 机 的 特殊 软 
件 运 行 的 。 这 个 软件 模拟 计算 机 ， 是 专 为 运 
行 在 Python 上 而 设计 的 ， 这 让 很 多 .pyc 文件 
无 需 做 任何 修改 就 能 在 不 同 的 计算 机 系统 上 


运行 。 


你 几乎 不 用 关心 .pyc 文件 。Python 在 
需要 时 会 自动 创建 它们 ， 并 在 你 修改 了 相应 
的 .py 文件 时 自动 更 新 它们 。 千 万 不 要 删除 、 
重 命名 或 修改 .pyc 文件 ! 


鉴于 .pyc 文件 仅 供 计算 机 阅读 ， 因 此 
它们 不 是 文本 文件 。 如 果 你 试图 在 文本 编辑 
器 中 查看 .pyc 文件 ， 看 到 的 将 是 一 堆 乱码 。 
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3.3 ”从 键盘 读 取 字 符 串 


从 键盘 读 取 字符 串 是 从 用 户 那 里 获取 信 
息 的 一 种 最 基本 的 方式 。 例 如 ， 请 看 下 面 这 
个 简单 程序 : 


# name .py 
name = input('What is your first name? ') 


print('Hello ' + name.capitalize()+ '!') 
要 在 IDLE 中 运行 它 ， 请 在 IDLE 窗口 中 


打开 name.py， 再 按 F5 (或 选择 菜单 Run > 
Run Module )。 此 时 将 出 现 一 个 窗口 : 


What is your first name? jack 


Hello Jack! 


你 ( 用户 ) 必须 输入 名 字 (这 里 为 jack )。 


3.3.1 跟踪 程序 

下 面 来 仔细 研究 这 个 程序 的 每 一 行 。 第 1 
行 是 源 代 码 注释 ( 简称 为 注释 )。 注释 不 过 是 
给 程序 员 阅 读 的 说 明 ，Python 对 其 置之不理 。 
Python 注释 总 是 以 符号 # 打头, 并 延续 到 行 尾 。 
这 里 的 注释 指出 ， 这 个 程序 存储 在 文件 name. 
py 中 。 


第 2 行 调用 函数 input， 这 是 用 于 从 键盘 
读 取 字 符 串 的 标准 内 置 函数 。 这 行 代码 执行 
时 ， 将 在 输出 窗口 中 显示 What is your first 
name? 和 闪烁 的 光标 。 程 序 等 待 用 户 输入 一 个 
字符 串 并 按 回 车 。 
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函数 input 返回 用 户 输 入 的 字符 串 ， 让 
变量 name 最 终 指向 用 户 输入 的 字符 串 。 


该 程序 的 第 3 行 ( 也 是 最 后 一 行 ) 显示 
一 句 问 候 语 。 也 数 name.capitalize() 确保 字 
符 串 的 第 一 个 字符 为 大 写 ， 而 其 他 字符 为 小 
写 。 这 样 ， 如 果 用 户 输入 的 名 字 没 有 采用 正 
确 的 首 字 母 大 写 方式 ，Python 将 更 正 。 


要 获悉 字符 串 包 含 哪些 函数 
IDLE 的 交互 式 命令 行 输入 dir('')。 


如 果 你 多 次 运行 程序 name.py， 且 每 
次 都 输入 不 同 的 字符 事 ， 将 很 快 发 现 当 你 输 
入 类 似 于 'Jack Aubrey' 的 姓名 时 ， 姓 的 首 字 
母 将 被 转换 为 小 写 : 'Hello Jack aubrey!'。 
这 是 因为 函数 capitalize 的 头脑 非常 简单 ， 
根本 没有 单词 和 空格 的 概念 。 


从 键盘 读 取 字符 串 时 ， 另 一 种 常见 的 
实用 技巧 是 ， 使 用 函数 strip() 将 开头 和 末尾 
的 空白 字符 删除 ， 如 下 所 示 : 

>>> ' oven '.strip() 


"oven'" 
因为 经 常 需要 删除 不 需要 的 空白 ， 所 以 我 们 
常常 像 下 面 这样 调 用 函数 input: 


name = input('Enter age: ').strip() 
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3.3.2 ”从 键盘 读 取 数 字 

函数 input 只 是 返回 字符 串 ， 因 此 如 果 
你 需要 的 是 数字 ( 如 用 于 算术 运算 )， 就 必须 
使 用 Python 的 数值 转换 函数 之 一 。 例如， 请 
看 下 面 的 程序 : 


# age.py 

age = input('How old are you today? ') 
age10 = int(age) + 10 

print('In 10 years you will be ”+ 
”str(age10) + ' years old.') 


假设 运行 该 程序 时 用 户 输入 22， 变 量 
age 将 指向 字符 串 '22' ， 因 为 Python 不 会 自 
动 将 看 起 来 像 数 字 的 字符 串 转换 为 整数 或 浮 
点 数 。 如 果 你 要 将 字符 串 用 于 算术 运算 ， 必 
须 先 将 其 转换 为 数字 。 为 此 ， 可 使 用 函数 
int(s)( 如 果 你 需要 的 是 整数 ) 或 float(s)( 如 
果 你 需要 的 是 浮 点 数 )。 


这 里 要 指出 的 最 后 一 个 技巧 是 ,在 print 
语句 中 , 必须 将 变量 age10 ( 它 指向 一 个 整数 ) 
转换 为 字符 串 ， 这 样 才能 打印 它 。 如 果 你 忘 
记 这 样 做 ， Python 将 显示 错误 消息 ， 指 出 不 
能 将 数字 与 字符 串 相 加 。 


不 同类 型 的 数字 

一 开始 ， 各 种 不 同 的 数值 类 型 令 你 迷 
惑 。 请 看 下 面 4 个 不 同 的 值 ; 5、5.0、 "5 
和 '5.0'。 虽 然 它 们 看 起 来 相似 ， 但 内 部 表 
示 截 然 不 同 。 


5 是 一 个 整数 ， 可 直接 用 于 算术 运算 。 


5.0 是 一 个 浮 点 数 ,也 可 用 于 算术 运算 ， 
但 包含 小 数 部 分 。 


'5" 和 "5.0' 都 是 字符 串 ， 分 别 包 含 1 
个 和 3 个 字符 。 字 符 串 可 显示 到 屏幕 上 或 
用 于 基于 字符 的 操作 ( 如 删除 空白 或 计算 
字符 数 )。 字符 串 不 能 用 于 算术 运算 。 当然， 
字符 串 可 用 于 拼接 ， 虽 然 结 果 可 能 让 人 觉 
得 有 点 不 合 情 理 。 例 如 : 


>>>330 + 005 
E555 
>>>33 5580Y 


5EO5RO5EOL 


(AD 

Oo 

(LAD 
地 
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Hg 

x 
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术语 说 明 
程序 员 常 常 使 用 术语 标准 输出 (stdout ) 
来 表示 文本 被 打印 到 的 窗口 。 通 常 ， 标 准 


输出 是 简单 的 文本 窗口 ， 几 乎 只 显示 字符 
事 ， 不 显示 任何 类 型 的 图 形 。 


同样 ， 标 准 输入 ( stdin ) 是 函数 input 
0 通常 是 标准 输出 
对 应 的 窗口 ， 但 必要 时 可 更 改 标 准 输入 和 
标准 输出 。 


你 有 时 还 会 看 到 输出 标准 错误 
( stderr )， 它 指 的 是 显示 和 站 
默认 情况 下 ， 错 误 消息 通常 在 标准 输出 中 
于 


3.4 在 屏幕 上 打印 字符 串 


print 语句 是 用 于 将 字符 串 打印 到 屏幕 的 
标准 内 置 函 数 。 正 如 你 将 看 到 的 , 它 非常 灵活 ， 
有 很 多 功能 可 用 于 正确 地 设置 字符 串 和 数字 
的 格式 。 


你 可 将 任意 数量 的 字符 串 传 递 给 print : 


>>> print('jack', 'ate'’, 'no', 'fat') 


jack ate no fat 


默认 情况 下 ，print 在 标准 输出 窗口 中 打 
印 每 个 字符 串 ， 并 用 空格 分 隔 它 们 。 修 改 字 
符 串 分 隔 符 很 容易 ， 可 以 像 下 面 这 样 做 : 


>>> print('jack', 'ate', 'no', 'fat', 
”Sep = ".") 
jack.ate.no.fat 


默认 情况 下 ，print 打印 完 指定 内 容 后 添 
加 一 个 换行 符 : \n。 换 行 符 导致 光标 移 到 下 
一 行 ， 因 此 默认 情况 下 ， 调 用 print 后 不 能 在 
同一 行 打印 任何 内 容 : 


# jack1.py 
print( jack ate ') 
print('no fat') 


述 代 码 打印 两 行文 本 : 


jack ate 

no fat 

要 在 同一 行 打 印 所 有 文本 ， 可 将 第 一 行 
结束 字符 指定 为 空 字符 串 : 


# jack2.py 
print('jack ate ', end = "') 
print('no fat') 
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Python 2 和 Python 3 的 主要 差别 之 
一 就 表现 在 函数 print 上 。 在 Python 2 中， 
print 从 技术 上 说 并 非 函 数 ， 而 是 语言 的 一 部 
分 。 这 带 来 的 优点 之 一 是 ， 你 可 以 不 输入 辆 
括号 ， 例 如 ， 可 以 输入 print 'jack ate no 
fat' 。 然 而 ，piint 不 是 函数 虽然 带 来 了 这 种 
小 小 的 便利 ， 但 导致 修改 默认 分 隔 符 和 结 
字符 串 非 常 困难 ， 而 在 比较 复杂 的 程序 中 常 
常 需要 这 样 做 。 


Python 2 和 Python 3 的 另 一 个 不 同 之 
处 在 于 ，Python 3 函数 input 对 应 于 了 Python 
2 函数 Taw input; Python 2 也 有 函数 input， 
但 它 对 用 户 输入 的 字符 串 求 值 ， 这 在 有 些 
情况 下 非常 方便 。 在 Python 3 中 ， 没 有 与 
Python 2 函数 input 等 价 的 函数 ， 但 可 轻松 地 
模拟 这 个 函数 一 一 使 用 eval(input(prompt) ) 。 
例如 : 

>>> eval(input('? ')) 

?4+5*6 

34 
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3.5 源 代 码 注释 


前 面 使 用 了 源 代码 注释 来 指出 文件 名 ， 
但 注释 还 可 用 于 在 程序 中 添加 各 种 说 明 ， 如 
文档 、 提 示 、 解 释 或 警告 。Python 忽略 所 有 
注释 ， 它 们 仅 供 你 和 其 他 可 能 阅读 源 代码 的 
程序 员 阅 读 。 


下 面 的 示例 程序 演示 了 注释 的 其 他 一 些 


用 途 : 
# coins short.py 
# This program asks the user how many 
# coins of various types they have, 
# and then prints the total amount 
# of money in pennies. 
# get the number of nickels, dimes, 
# and quarters from the user 


n = int(input('Nickels? ')) 
int(input('Dimes? ')) 


[~ 
四 


int(input('Quarters? ')) 


BS = ] 
四 


# calculate the total amount of money 
total =5*n+10*d+25*q 

# print the results 

print() # prints a blank line 
print(str(total) + ' cents') 
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3.6 ”程序 的 组 织 


随 着 编写 的 程序 越 来 越 多 ， 你 将 很 快 发 输入 
现 它 们 通常 采用 相同 的 结构 。 人 们 通常 按 图 
3-2 所 示 的 方式 组 织 程序 : 包含 输入 部 分 、 处 
理 部 分 和 输出 部 分 。 


在 我 们 刚 开始 编写 的 小 型 程序 中 ， 这 种 处 理 
结构 通常 显而易见 ， 无 需 做 太 多 的 考虑 。 但 
随 着 程序 越 来 越 大 、 越 来 越 复 杂 ， 很 容易 偏 
离 这 种 总 体 结构 ， 其 结果 常常 是 代码 混乱 、 
难以 理解 。 输出 


因此 ， 应 该 养 成 良好 的 习惯 一 使 用 注 
释 指 出 输入 、 处 理 和 输出 部 分 。 这 有 助 于 曾 。 图 3-2 大 多 数 程序 都 采用 这 里 所 示 的 结构 ， 首先 
明 程 序 执行 的 不 同 任务 。 当 你 开始 编写 函数 ”获取 输入 (例如 ,使 用 函数 input 从 用 户 那里 获取 )， 
时 ,将 发 现 这 种 结构 提供 了 很 好 的 指导 ， 让 然后 对 输入 进行 处 理 ， 最 后 向 用 户 显示 结果 
你 能 够 将 程序 合理 地 划分 成 多 个 函数 
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流程 控 制 


前 面 编写 的 程序 都 是 直线 式 的 ， 由 一 系 
列 依次 执行 的 Python 语句 组 成 。 这 些 程序 按 
顺序 执行 语句 ， 没 有 分 支 ， 也 不 会 返回 到 以 
前 的 语句 。 


本 章 介 绍 如 何 使 用 放 语句 和 循环 来 改变 
语句 的 执行 顺序 。 对 任何 重要 的 程序 来 说 ， 
if 语句 和 循环 都 是 必 不 可 少 的 。 


计 语 句 和 循环 都 由 录 辑 表达 式 控制 ， 
此 本 章 将 首先 介绍 布尔 逻辑 。 


请 仔细 阅读 本 章 的 示例 程序 ， 并 花 点 时 
间 进 行 尝试 和 修改 。 


本 章 内 容 

口 布尔 逻辑 

口 if 语句 

口 代码 块 和 缩 进 

口 循环 

口 比较 for 循环 和 while 循环 
口 跳出 循环 和 语句 块 


口 循环 中 的 循环 


4.1 布尔 逻辑 


与 大 多 数 编程 语言 一 样 ，Python 也 使 用 
布尔 逻辑 来 做 决策 。 布 尔 逻 辑 就 是 操作 真 值 ， 
而 在 Python 中 ， 这 些 真 值 用 True 和 False 表 
示 。 布 尔 逻 辑 比 算术 运算 简单 ， 对 你 知道 的 
逻辑 规则 进行 了 规范 化 。 


我 们 使 用 4 个 主要 的 逻辑 运算 符 (也 叫 
逻辑 连接 符 ) 来 组 合 布尔 值 : not、and、or 
和 ==。 在 Python 及 所 有 计算 机 语言 中 ， 所 有 
决策 都 可 使 用 这 些 逻 辑 运算 符 来 做 出 。 


假设 p 和 9q 是 两 个 Python 变量 ， 且 都 是 
布尔 值 。 由 于 p 和 9q 都 有 两 个 可 能 取 值 (True 
或 False )， 所 以 有 4 种 不 同 的 组 合 ， 如 表 4-1 
的 前 两 列 所 示 。 现 在 可 以 这 样 定 义 逻 辑 运 算 
符 了 :用 逻辑 运算 符 将 真 值 p 和 9q 连接 起 来 时 ， 
得 到 的 结果 是 什么 。 这 些 定义 被 称 为 真 值 表 ， 
而 Python 使 用 它们 的 内 部 版 本 来 计算 布尔 表 
达 式 的 值 。 


表 4-1 基本 逻辑 运算 符 的 真 值 表 


p q P == 9 pP != 9 pP and q P o 9 not p 
False False True False False False True 
False True False True False True True 
True False False True False True False 
True True True False True True False 
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4.1.1 逻辑 相等 


咱们 从 == 开始 吧 。 仅 当 p 和 4 包含 的 真 
值 相同 ， 即 都 为 True 或 都 为 False 时， 表达 
式 p == 4 的 结果 才 为 True。 表 达 式 p != q 检 
测 p 和 9 是 否 不 同 ， 仅 在 p 和 9 不 同时 才 返 
回 True。 


>>> False == False 
True 

>>> True == False 
False 

>>> True == True 
True 

>>> False != False 
False 

>>> True != False 
True 

>>> True != True 


False 


4.1.2 ”逻辑 与 


仅 当 p 和 9q 都 为 True 时 ,布尔 表达 式 的 
结果 才 为 True， 而 在 其 他 情况 下 都 为 False。 
表 4-1 的 第 5 列 总 结 了 各 种 组 合 的 结 


>>> False and False 
False 

>>> False and True 
False 

>>> True and False 
False 

>>> True and True 


True 


4.1.3 ”逻辑 或 


仅 当 p 和 9q 至 少 有 一 个 为 True 时 ， 布 尔 
表达 式 p or q 才 为 True。 表 4-1 的 第 6 列 对 
此 做 了 总 结 。 唯 一 一 个 稍微 有 点 琼 手 的 情形 
是 , p 和 9q 都 为 True。 在 这 种 情形 下 ， 表 达 式 
p or 9q 的 结果 为 True。 


>>> False or False 
False 

>>> False or True 
True 

>>> True or False 

True 

>>> True or True 


True 


4.1.4 ”逻辑 非 


最 后 ， 在 p 为 False 时 ,布尔 表达 式 not 
p 的 结果 为 True; 而 在 p 为 True 时 ， 结 果 为 
False。 结 果 与 变量 的 值 相反 。 


>>> not True 
False 
>>> not False 


True 
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4.1.5 ”计算 较 长 的 布尔 表达 式 

布尔 表达 式 用 于 控制 if 语句 和 循环 ， 你 
必须 明白 如 何 计算 它们 的 值 ， 这 很 重要 。 与 
算术 表达 式 一 样 ， 布 尔 表达 式 使 用 圆 括号 和 
运算 符 优先 级 来 指定 其 各 个 部 分 的 计算 顺序 。 


4.1.6 计算 包含 圆 括号 的 布尔 表达 式 
假设 我 们 要 计算 表达 式 not (True and 
(False or True)) 的 值 ,可 以 按 下 面 的 步骤 做 。 


1. 总 是 首先 计算 圆 括号 内 的 表达 式 ， 
此 首先 计算 False or True， 结 果 为 True。 
此 ， 原 来 的 表达 式 与 下 面 这 个 更 简单 的 表达 
式 等 价 : 


not (True and True) 


2. 为 计算 这 个 表达 式 ， 我 们 再 次 先 计 算 
圆 括号 内 的 表达 式 : True and True， 其 结 
果 为 True。 因此 ， 上 述 表 达 式 等 价 于 表达 式 


not True, 


3. 最 后 ， 为 计算 这 个 表达 式 ， 我 们 只 需 
在 表 4-1 的 最 后 一 列 查找 答案 : not True 的 
结果 为 False。 因 此 表达 式 not (True and 
(False or True)) 的 结果 为 False。 要 使 用 
Python 来 验证 这 一 点 很 容易 ， 只 需 像 下 面 这 
样 做 : 

>>> not (True and (False or True)) 


False 
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尔 运算 的 优先 级 ( 按 从 高 到 低 的 顺序 排列 ) ”4.1.7 “计算 不 包含 圆 括号 的 布尔 表达 式 


假设 要 计算 表达 式 not True and False 
orTrue 的 值 。 这 个 表达 式 与 前 一 个 相同 ， 但 
没有 圆 括号 。 


1. 首先 计算 优先 级 最 高 的 运算 ( 表 4-2 
列 出 了 运算 符 的 优先 级 )。 在 这 里 ，not 的 优 
先 级 最 高 ， 因 此 首先 计算 not True ( 它 位 于 
表达 式 开 头 ， 但 纯 属 巧合 )。 经 过 这 种 计算 
后 ， 整 个 表达 式 简 化 成 了 False and False or 
Trves 


2. 再 次 计算 优先 级 最 高 的 运算 符 。 根 据 
表 4-2 可 知 ，and 的 优先 级 比 or 高 ， 因 此 先 
计算 False and False。 表 达 式 简化 为 False 


or True, 
3. 通过 查找 表 4-1 中 的 答案 可 知 ， 这 个 


表达 式 的 结果 为 True。 因此， 最 初 的 表达 式 
False and not False or True 的 结果 为 True。 


ER 编写 复杂 的 布尔 表达 式 时 ， 不 使 用 辆 
括号 通常 是 个 馒 主意 ， 因 为 这 将 导致 表达 式 
难以 阅读 和 计算 一 一 并 非 所 有 程序 员 都 能 记 
住 布尔 运算 符 的 优先 级 顺序 ! 


SEE 一 个 例外 是 连续 多 次 使 用 同一 个 逻辑 
运算 符 时 。 在 这 种 情况 下 ， 不 使 用 圆 括 号 通 
常 更 容易 阅读 ， 例 如 : 

>>> (True or (False or (True or False))) 

True 

>>> True or False or True or False 


True 
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4.1.8 短路 求 值 

表 4-1 所 示 的 逻辑 运算 符 定义 是 标准 定 
义 ， 为 所 有 逻辑 教科 书 所 采用 。 然 而 ， 与 大 
多 数 现代 编程 语言 一 样 ，Python 也 采用 了 一 
个 被 称 为 短路 来 值 的 技巧 ， 这 可 提高 某 些 布 
尔 表达 式 的 计算 速度 。 


请 看 布尔 表达 式 False and X， 其 中 X 为 
任何 布尔 表达 式 。 不 管 X 的 结果 为 True 还 是 
False， 整 个 表达 式 的 结果 都 为 False， 因 为 
开头 的 False 导致 整个 and 表 达 式 为 False， 
所 以 表达 式 False and X 的 值 不 依赖 于 x 一 一 
总 是 为 False。 在 这 样 的 情况 下 ，Python 根本 
不 计算 xX 的 值 ， 而 在 遇 到 False and 时 就 此 罢 
手 ， 并 返回 结果 False。 这 可 提高 布尔 表达 式 
的 计算 速度 。 


同样 ， 布 尔 表 达 式 True or X 的 结果 总 是 
为 True， 而 不 管 x 的 值 是 什么 。 表 4-3 描述 
了 Python 进行 短路 求 值 时 遵循 的 规则 。 


在 大 多 数 情 况 下 ， 你 都 无 需 考 虑 短路 问 
题 ， 就 能 享受 它 带 来 的 性 能 改善 。 然 而 ， 衬 
记 Python 进行 短路 求 值 很 有 帮助 ， 因 为 它 偶 
尔 会 导致 难以 发 现 的 bug。 


利用 表 4-3 中 and 和 or 的 定义 ， 可 编 
写 简洁 而 巧妙 的 代码 来 模拟 下 一 节 将 介绍 的 
if 语 句 。 然而 ,这 种 表达 式 的 可 读 性 通常 极 差 ， 
如 果 你 在 他 人 编写 的 Python 代码 中 遇 到 这 种 
表达 式 ( 在 你 自己 的 程序 中 , 绝 不 要 这 样 做 )， 
可 能 需要 参考 表 4-3 来 搞 清楚 他 们 想 做 什么 。 


表 4-3 ”Python 中 的 布尔 运算 符 定义 


运 算 结 果 
pordq 如 有 果 p 为 False， 结果 为 9， 否则 结果 为 p 
p and q ”如 果 p 为 False， 结果 为 p， 否 则 结果 为 q 
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4.2 ”if 语句 


if 语句 让 你 能 够 改变 Python 程序 的 执行 
流程 ， 它 能 让 你 在 程序 中 做 出 决策 : 在 程序 
运行 时 ， 该 运行 这 个 代码 块 还 是 男 一 个 代码 
块 。 几 乎 所 有 重要 的 程序 都 使 用 if 语句 ， 
此 你 必须 明日 这 种 语句 。 


if/else 语句 

假设 你 要 编写 一 个 检查 密码 的 程序 : 用 
户 输入 密码 ， 如 果 正 确 ， 就 让 用 户 使 用 其 账 
户 登 录 ; 否则 告诉 用 户 输入 的 密码 不 正确 : 


# password1.py 
pwd = input('What is the password? ') 


if pwd == 'apple': # note use of == 
* # instead of = 


print('Logging on ...') 
else: 
print('Incorrect password.') 


print('All done!') 


这 个 程序 很 容易 理解 : 如 果 变 量 pwd 指 
向 的 字符 串 为 'apple', 就 打印 一 条 登录 消息 ; 
否则 打印 消息 Incorrect password。 


if 语句 总 是 以 关键 字 if 打头 ， 而 这 个 关 
键 字 后 面 总 是 一 个 布尔 表达 式 。 这 种 表达 式 
被 称 为 if 条 件 (简称 为 条 件 )。 诗 条 件 后 面 
是 一 个 冒号 (: )。 正 如 你 将 看 到 的 ，Python 
将 : 用 作 if 语句 头 、 循 环 头 和 函数 头 的 结 
标记 。 
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从 诗 到 : 的 部 分 被 称 为 计 语 句 头 。 如 
果 计 语句 头 中 的 条 件 为 True， 将 立即 执行 
语句 print( Logging on .…… )， 并 跳 过 请 名 
print('Incorrect password.'), 永远 不 执行 它 。 

如 果 if 语句 头 中 的 条 件 为 False， 将 跳 
过 语句 print('Logging on ...')， 只 执行 语 
名 print('Incorrect password.')。 无 论 在 哪 
种 情况 下 ， 都 会 执行 最 后 的 语句 print('All 


done!')。 


4-1 说 明了 if/else 语句 的 基本 结构 。 


我 们 通常 将 包含 多 行 的 整个 if 结构 
是 为 一 条 if 语句 。 


提 示 | 


你 必须 在 关键 字 if 后面 至 少 添 加 一 
个 空格 。 


关键 字 if、 
同一 行 。 


条 件 和 结尾 的 : 必须 位 于 


在 if 语 句 中 ，else 代码 块 是 可 选 的 ， 
可 根据 要 解决 的 问题 决定 是 否 包含 它 。 


before_block | 
if cond: 
true_block 
else: 
false_block 
after_block 


否 


Y 


六 


村 


before_block | 


cond 为 true? 


| false_block | 
after_block 


true_block 


4-1 


这 个 流程 图 说 明了 if/else 语句 的 基本 格式 和 行为 ， 其 中 的 代码 


块 可 包含 任意 数量 的 Python 语句 (包括 其 他 if 语句 ! ) 
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IDLE 自动 为 你 缩 进 代码 。 例 如 ， 当 
你 在 if 语句 头 中 输入 : 并 按 回 车 键 时 ， 将 自 
动 在 下 一 行 缩 进 光 标 。 


缩 进 量 很 重要 ， 在 Python 语句 块 中 ， 
多 一 个 或 少 一 个 空格 都 可 能 导致 错误 或 意外 
行为 。 在 同一 个 代码 块 中 ， 所 有 语句 的 缩 进 
量 必须 相同 。 


4.3 ”代码 块 和 缩 进 

Python 的 一 个 与 众 不 同 之 处 是 ， 使 用 缩 
进来 标识 代码 块 。 请 看 下 述 if 语句 ， 它 摘自 
前 述 检查 密码 的 程序 : 


if pwd == “apple' : 
print('Logging on ...') 
else: 
print('Incorrect password.') 


print('All done!') 


代码 行 print('Logging on ...') 和 print 
('Incorrect password.') 是 两 个 不 同 的 代码 
块 。 这 些 代码 块 只 有 一 行 ， 但 Python 允许 你 
编写 包含 任意 数量 语句 的 代码 块 。 


要 在 Python 中 标识 代码 块 ， 必 须 以 同样 
程度 缩 进 代码 块 的 每 一 行 。 在 前 述 if 语句 示 
例 中 ， 两 个 代码 块 都 缩 进 了 4 个 空格 ， 这 是 
典型 的 Python 缩 进 量 。 


在 其 他 大 多 数 编程 语言 中 ， 缩 进 只 用 于 
让 代码 更 美观 ; 但 在 Python 中 ， 必 须 使 用 缩 
进来 指出 语句 所 属 的 代码 块 。 例 如 ， 最 后 一 
条 语句 final print('All done!') 没有 缩 进 ， 
此 不 属于 else 代码 块 。 


对 于 缩 进 很 重要 的 理念 ， 熟 悉 其 他 语言 
的 程序 员 常 常 不 以 为 然 : 很 多 程序 员 喜 欢 自 
由 ,希望 能 够 随心 所 欲 地 设置 代码 的 格式 。 
然而 ，Python 的 缩 进 规则 符合 很 多 程序 员 用 
来 改善 代码 可 读 性 的 风格 。Python 只 是 让 这 
种 理念 更 进一步 ， 赋 予 缩 进 以 一 定 的 含义 。 
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4.3.1 if/elif 语句 


if/elif 语句 是 if 语句 推广 版 本 ， 它 包 
含 多 个 条 件 ， 用 于 做 出 复杂 的 决策 。 例 如 ， 
假设 航空 公司 提供 了 如 下 儿童 优惠 票 价 : 不 
超过 2 岁 的 儿童 免费 ; 2~13 岁 的 儿童 打折 ; 
13 岁 及 更 大 的 儿童 与 成 人 同 价 。 下 面 的 程序 
计算 乘客 应 支付 的 费用 : 


# airfare.py 
age = int(input('How old are you? ')) 
if age <= 2: 
print(' free') 
elif 2 < age < 13: 
print(' child fare) 
else: 


print('adult fare') 


从 用 户 那 里 获取 age 的 值 后 ，Python 进 
入 if/elif 语句 ， 按 指定 顺序 依次 检查 每 个 
条 件 。 因 此 ， 它 首先 检查 age 是 否 小 于 2， 如 
果 是 这 样 ， 就 指出 免费 并 跳出 if/elif 语句 。 
如 果 age 不 小 于 2， 则 检查 下 一 个 elif 条 件 ， 
看 看 age 是 否 在 2 和 13 之 间 。 如 果 是 这 样 ， 
就 打印 相应 的 消息 ， 并 跳出 if/elif 语句 。 如 
果 if 条 件 和 elif 条 件 都 不 为 True， 则 执行 
else 代码 块 中 的 语句 。 


elif 是 else if 的 缩写 ， 
要 使 用 任意 数量 的 elif 语句 块 。 


你 可 根据 需 


在 if/elif 语句 中 ,每 个 代码 块 的 缩 
进 量 必须 相同 。 


与 常规 if 语 句 一 样 ，else 代码 块 是 
可 选 的 ,在 包含 else 语 句 块 的 if/elif 语 名 中， 
只 有 一 个 语 多 块 会 被 执行 ; 如 果 没 有 else 语 
和 句 块 ， 则 可 能 没有 任何 条 件 为 True， 在 这 种 
情况 下 ， 将 不 会 执行 if/elif 语句 中 的 任何 代 
码 块 。 
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4.3.2 条件 表达 式 

Python 还 有 一 个 逻辑 运算 符 ， 但 有 些 程 
序 员 喜 欢 ， 有 些 程序 员 讨 厌 ! 它 基本 上 就 是 
if 语句 的 简写 ， 可 直接 用 于 表达 式 中 。 请 看 
下 面 的 代码 : 


food = input("What's your favorite food? ") 
reply = 'yuck' if food == 'lamb' else “yum' 


在 第 2 行 ，= 右边 的 表达 式 被 称 为 条 件 
表达 式 ， 其 结果 要 么 为 "yuck' 要 么 为 "yum'。 
上 述 代码 与 下 面 的 代码 等 价 : 


food = input("What's your favorite food? ") 
if food == 'lamb": 


reply = “yuck” 
else: 
reply = "yum’ 


条 件 表达 式 通常 比 等 价 的 if/else 语句 简 
短 ， 但 并 非 总 是 与 if/else 语句 一 样 灵 活 和 易 
于 理解 。 一 般 而 言 ， 仅 当 条 件 表 达 式 可 让 代 
码 更 简单 时 才 使 用 它们 。 
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4.4 循环 


下 面 将 注意 力 转 向 循环 。 循 环 用 于 重复 
地 执行 代码 块 ，Python 有 两 种 主要 的 循环 : 
for 循环 和 while 循环 。for 循环 通常 比 while 
循环 更 容易 使 用 ， 也 不 那么 容易 出 错 ， 但 没 
有 while 循环 灵活 。 


4.4.1 ”for 循环 


基本 for 循环 重复 执行 给 定 代码 块 指定 
的 次 数 。 例 如 ， 下 面 的 代码 片段 在 屏幕 上 打 
印 数字 0~9: 


# count10.py 
for i in range(10): 


print(i) 


for 循环 的 第 1 行 被 称 为 for 循 环 头 。 
for 循环 总 是 以 关键 字 for 打头 ， 接 下 来 是 循 
环 变 量 ( 这 里 为 i )， 然 后 是 关键 字 in。 关 键 
字 in 后 面 通常 (但 并 非 总 是 ) 是 range(n) 和 
结束 符号 :。for 循环 重复 执行 循环 体 ( 循环 
头 后 面 的 语句 块 ) n 次 。 


每 次 执行 循环 时 ， 循 环 变量 都 被 设置 为 
下 一 个 值 。 默 认 情 况 下 ， 初 始 值 为 0， 并 逐步 
递增 到 nn-1 ( 而 不 是 n)。 从 0 而 不 是 1 开始 
可 能 看 起 来 有 点 怪 ， 但 在 编程 中 很 常见 。 如 
有 果 要 修改 循环 的 初始 值 ， 可 在 range 中 添加 初 
始 值 : 


for i in range(5, 10): 


print(i) 


上 述 代 码 打 印 数 字 5~9。 


术语 说 明 

程序 员 经 常 使 用 变量 1， 因为 它 是 索引 
(index ) 的 缩写 ， 且 常用 于 数学 中 。 等 你 开 
始 使 用 循环 中 的 循环 时 ， 通 常 将 j 和 Kk 用 
作 其 他 循环 变量 名 。 
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人 如 有 果 你 要 打印 数字 1~10 (而 不 是 
0~9 )， 有 两 种 常见 的 办 法 ， 一 种 是 修改 范围 
的 起 始 值 和 终止 值 。 

for i in range(1, 11): 


print(i) 
另 一 种 是 在 循环 体 中 给 了 加 1。 


for i in range(10): 


print(i + 1) 


如 果 你 想 按 相反 的 顺序 打印 数字 ， 也 4 
有 两 种 标准 做 法 。 第 一 种 是 这 样 设置 范围 参数 。 

for i in range(10, 0, -1): 

print(i) 

注意 到 第 一 个 参数 为 10， 第 二 个 参数 为 0， 
而 第 三 个 参数 ( 被 称 为 步 长 ) 为 -1。 另 一 种 
做 法 是 使 用 更 简单 的 范围 ， 并 在 循环 体 中 修 
政 i。 

for i in range(10): 


print(10 - i) 


for 循环 实际 上 比 本 节 描 述 得 更 通用 。 
可 将 for 循环 用 于 任何 类 型 的 迭代 器 一 一 一 
种 返回 值 的 特殊 编程 对 象 。 例 如 ，for 循环 是 
读 取 文本 文件 各 行 的 最 简单 方式 ， 你 将 本 书 
在 后 面 看 到 这 一 点 。 
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4.4.2 while 循环 


第 二 种 Python 循环 是 while 循环 。 请 看 
下 面 的 程序 : 


# while10.py 

i=0 

while i < 10: 
print(i) 


i=i+1#add1itoi 


这 个 程序 在 屏幕 上 打印 数字 0~9。 它 比 
for 循环 要 复杂 得 多 ,但 也 更 灵活 。 


while 循环 本 身 以 关键 字 while 打头 ， 这 
一 行 被 称 为 while 循环 头 ， 而 它 后 面 缩 进 的 代 
码 被 称 为 while 循环 体 。 


while 循环 头 总 是 以 while 打头 ， 后 面 跟 
着 循环 条 件 返回 True 或 False 的 布尔 表 
达 式 。 


while 循环 的 控制 流程 类 似 于 这 样 : 首先 ， 
Python 检查 循环 条 件 为 True 还 是 False， 如 
果 为 True， 就 执行 循环 体 ; 如 果 为 False， 就 
跳 过 循环 体 ( 即 跳出 循环 ) 并 执行 后 面 的 语句 。 
在 条 件 为 True 并 执行 循环 体 后 ，Python 再 次 
检查 条 件 。 只 要 循环 条 件 为 True，Python 就 
不 断 执行 循环 。 图 4-2 是 这 个 程序 的 流程 图 。 


示例 程序 的 第 1 行为 i = 0， 在 循环 语 境 
下 ， 这 种 语句 被 称 为 初始 化 语句 。 与 for 循 
环 那 样 自 动 初始 化 循环 变量 不 同 ， 由 程序 员 
负责 给 while 循环 使 用 的 变量 指定 初始 值 。 


并 


Y 


print(i) 


i=i+1 


4-2 ”这 是 从 0 数 到 9 的 代码 对 应 的 流程 图 。 注 
意 到 循环 条 件 为 False( 即 从 决策 箱 进入 " 否 " 分 支 ) 
时 ， 箭 头 并 没有 指向 一 个 箱子 ， 这 是 因为 在 这 里 的 
示例 代码 中 ，while 循环 后 面 没有 任何 代码 


A 
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循环 体 的 最 后 一 行为 1 = i + 1。 正 如 源 
代码 注释 指出 的 ， 这 行 代 码 将 i 的 值 加 1。 因 
此 ， 随 着 循环 的 进行 ，i 的 值 不 断 递增 ， 确 保 
循环 终 将 终止 。 在 while 循环 中 ,这 一 行 被 称 
为 递增 语句 ， 因 为 其 职责 是 让 循环 变量 递增 。 


图 4-3 所 示 的 流程 图 演示 了 通用 的 while 
循环 。 


虽然 几乎 所 有 while 循环 都 需要 初始 化 
语句 和 递增 语句 ， 但 Python 并 未 要 求 必须 包 
含 它 们 。 确 保 包 含 这 些 代 码 行 完全 是 程序 员 
的 职责 。 即 便 是 经 验 丰富 的 程序 员 也 会 发 现 ， 
初始 化 语句 和 递增 语句 是 导致 错误 的 常见 罪 


丢 祸 首 。 
initializer_block | 
while cond: 
body_block initializer_block 
after_block | 


cond 为 true? 


| | body_block 


after_block <* 一 一 


4-3 个 描述 通用 while 循环 的 流程 图。 注意 到 这 里 没有 专 
门 列 出 递增 语句 ， 因 为 它 位 于 body_block 中 通常 (但 并 非 
总 是 ) 位 于 body_block 的 末尾 
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While 往 疡 委 灵 治 得 多 。 在 While 锌 
环 前 面 ， 你 可 使 用 任何 代码 完成 任何 必要 的 
初始 化 。 循 环 条 件 可 以 是 任何 布尔 表达 式 ， 
递增 语句 可 放 在 while 循环 体内 的 任何 位 置 ， 
并 让 它 做 任何 你 喜欢 的 事情 。 


永远 不 会 结束 的 循环 被 称 为 无 限 特 
环 。 例 如， 下 面 的 循环 就 永 不 停止 : 
while True: 


print('spam') 


6 有 些 程序 员 喜 欢 将 无 限 循 环 作为 一 种 
快速 编写 循环 的 方式 。 然 而 ， 这 通常 被 认为 
是 一 种 糟糕 的 风格 ， 因 为 这 样 的 循环 通常 复 
杂 而 难以 理解 。 


很 多 Python 程序 员 都 尽量 使 用 for 循 
环 ， 仅 在 万 不 得 已 时 才 使 用 while 循环 。 


while 和 循环 可 包含 一 个 else 语 多 
块 ， 但 这 是 一 种 不 同 寻 常 的 特性 ， 实 际 上 很 
少 使 用 ， 因 此 这 里 不 讨论 。 如 果 你 对 此 有 兴 
趣 ， 可 阅读 Python 在 线 文档 ， 如 http://docs. 


python.org/3/reference/compound stmts.html。 
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4.5 比较 for 循环 和 while 循环 


下 面 来 通过 一 些 示 例 演 示 如 何 使 用 for 
循环 和 while 循环 解决 相同 的 问题 。 另 外 ， 还 
将 介绍 一 个 使 用 for 循环 编写 不 出 来 的 简单 
程序 。 


4.5.1 计算 阶乘 
阶乘 是 类 似 于 这 样 的 数字 : 1 x 2 x 3 x 
xn， 指 出 了 将 n 个 物体 排列 时 有 多 少 种 方 
式 。 例 如 ， 排 列 字 母 ABCD 时 ， 有 1 x2 x 
3 x 4=24 种 不 同 的 方式 。 下 面 是 一 种 使 用 
for 循环 计算 阶乘 的 方式 : 


# forfact.py 
n = int(input('Enter an integer >= 0: ')) 
faet = 1 
for i in range(2, n + 1): 
fact = fact * i 


print(str(n) + ' factorial is ' + str(fact)) 


下 面 是 另 一 种 使 用 while 循环 计算 阶乘 
的 方式 : 


# whilefact.py 
n = int(input('Enter an integer >= 0: ')) 
fact = 1 
1 
while i <= n: 
fact = fact * i 
小 


print(str(n) + ' factorial is ' + str(fact)) 
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在 用 户 看 来 ， 这 两 个 程序 的 行为 相同 ， 
但 内 部 结构 有 天 壤 之 别 。 与 往常 一 样 ，while 
循环 版 本 比 for 循环 版 本 要 复杂 些 。 


在 数学 中 ,使 用 吕 来 表示 阶乘 。 例 如 ， 
4!=1Xx2x3x4=24。 根 据 定义 01=1。 
有 趣 的 是 ， 没 有 计算 阶乘 的 简单 公式 。 


Python 对 整数 的 最 大 取 值 没有 限制 ， 
因此 你 可 以 使 用 这 些 程序 来 计算 非常 大 的 阶 
乘 。 例 如 ， 一 幅 扑 克 牌 的 排列 方式 有 521 种 : 
Enter an integer >= 0: 52 
52 factorial is 80658175170943878571 


”6606368564037669752895054408832778 
* 24000000000000 
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4.5.2 ”计算 用 户 输入 的 数字 的 总 和 

下 面 的 程序 让 用 户 输 入 一 些 数字 ， 然 后 
打印 出 这 些 数字 的 总 和 。 这 是 使 用 for 循环 
的 版 本 : 


# forsum.py 
n = int(input('How many numbers to sum? ')) 
total = 0 
for i in range(n): 

s = input('Enter number ' + 

» str(i + 1)+ ': ') 

total = total + int(s) 

print('The sum is ' + str(total)) 


这 是 使 用 while 循环 的 版 本 : 


# whilesum.py 
n = int(input('How many numbers to sum? ')) 
total = 0 

一 和 

while i <= nN: 


s = input('Enter number 


total = total + int(s) 


+ str(i) + ': ') 


i=i+1 


print('The sum is ' + str(total)) 


同样 ，while 循环 版 本 比 for 循环 版 本 更 


滞 ”这 些 程序 假设 用 户 输入 的 是 整数 。 如 
用 户 输入 的 是 浮 点 数 ， 调 用 int(s) 时 将 截 
短 它们 。 当 然 , 要 支持 用 户 输入 浮 点 数 很 容易 ， 
只 需 将 int(s) 改 为 float(s) 即 可 。 


AN 


4.5 比较 for 循环 和 while 循环 61 
图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


4.5.3 ”计算 未 知 个 数字 的 总 和 

下 面 介绍 一 种 情形 ， 使 用 前 面 介绍 的 for 
循环 无 法 处 理 这 种 情形 。 假 设 我 们 要 让 用 户 
输入 一 系列 数字 ， 以 计算 它们 的 总 和 ， 但 预 
先 并 不 询问 用 户 有 多 少 个 数字 。 相 反 ， 用 户 
输入 所 有 的 数字 后 ， 只 需 输 入 "done ' 来 指出 
这 一 点 。 下 面 演示 了 如 何 使 用 while 循环 来 完 
成 这 项 任务 。 


# donesum.py 
total = 0 
s = input('Enter a number (or "done"): ') 
while s != 'done': 
num = int(s) 
total = total + num 
s = input('Enter a number (or "done"): ') 


print('The sum is ' + str(total)) 

这 里 的 基本 思想 是 ， 不 断 要 求 用 户 输入 
数字 ， 直 到 用 户 输入 'done' 才 黑 手 。 这 个 程 
序 预先 并 不 知道 循环 体 将 执行 多 少 次 。 
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请 注意 下 面 几 个 细节 。 


口 我 们 必须 在 两 个 地 方 调用 input: 循环 
前 面 及 循环 体内 。 之 所 以 必须 这 样 做 ， 
是 因为 循环 条 件 判 断 输 入 是 数字 还 是 


'done', 


口 在 循环 体内 ,语句 的 排列 顺序 至 关 重 
要 。 如 果 循 环 条 件 为 True， 就 说 明 s 
不 是 'done' ， 所 以 假定 它 是 一 个 整数 。 
因此 ， 我 们 可 以 将 它 转换 为 整数 ， 将 
其 与 总 和 相 加 ， 并 让 用 户 接着 输入 。 


口 仅 当 确 定 输入 字符 串 s 不 是 字符 串 
'done' 后 ， 我 们 才 把 它 转 换 为 整数 。 
如 果 像 前 面 那样 编写 下 面 这 样 的 代码 ， 
则 用 户 输 入 'done' 时 程序 将 崩溃 。 

s = int(input('Enter a number 
» (or "done"): ')) 


口 不 再 需要 计数 需 变 量 1。 在 前 面 计 算 
总 和 的 程序 中 ,i 用 于 记录 用 户 输 入 
了 多 少 个 数字 。 一 般 而 言 ， 程 序 包含 
的 变量 越 少 , 越 容易 理解 .调试 和 扩展 。 
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4.6 ”跳出 循环 和 语句 块 


break 语句 提供 了 一 种 便利 方式 ， 让 你 
能 够 从 循环 体内 的 任何 地 方 跳出 循环 。 例 如 ， 
下 面 是 男 一 种 计算 未 知 个 数字 总 和 的 方式 : 


# donesum break.py 
total = 0 
while True: 
s = input('Enter a number (or "done"): ') 
if s == 'done': 
break # jump out of the loop 
num = int(s) 
total = total + num 
print('The sum is ' + str(total)) 


while 循环 条 件 为 True， 这 意味 着 将 永 


远 循 环 下 去 ， 直 到 break 被 执行 。 仅 当 s 为 
'done' 时 ，break 才 被 执行 。 


相 比 于 donesum.py， 这 个 程序 的 一 个 优 
点 是 ， 没 有 重复 input 语句 ; 但 缺点 在 于 终 
止 循环 的 条 件 位 于 循环 体 中 。 在 这 样 的 小 程 
序 中 ， 不 难 明 白 这 一 点 ,但 在 较 大 的 程序 中 ， 
break 语句 可 能 不 容易 理解 。 另 外 ， 你 可 以 使 
用 任意 数量 的 break 语句 ,这 让 循环 更 难 理解 。 
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一 般 而 言 ， 明 智 的 选择 是 ， 除 非 break 
语句 让 代码 更 简单 或 更 清晰 ， 否 则 不 要 使 
用 它 。 

一 个 与 break 相关 的 语句 是 continue 话 
句 : 在 循环 体 中 调用 continue 时 ， 将 立即 跳 
转 到 循环 条 件 ， 即 进入 循环 的 下 一 次 迭代 。 它 
不 像 break 那么 常见 , 但 通常 也 应 避免 使 用 它 。 


ER 语句 break 和 continue 也 可 用 于 for 
循环 中 。 
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4.7 ”循环 中 的 循环 


循环 中 的 循环 也 叫 谈 套 循环 ， 在 编程 中 
相当 常见 。 例 如 ， 下 面 是 一 个 打印 九 九 乘法 
表 的 程序 : 


# timestable.py 
for row in range(1, 10): 
for col in range(1, 10): 
prod = row * col 
if prod < 10: 
print(' ', end = "') 
print(row * col, ' ', end = "') 


print() 


请 注意 这 个 程序 中 的 代码 缩 进 情况 : 你 
根据 缩 进 人 
print() 语句 与 第 2 条 for 语句 对 齐 ， 这 意味 
着 它 属 于 外 部 〈 而 不 是 内 部 ) for 循环 。 


注意 到 使 用 了 语句 if prod < 10 来 确保 
输出 整齐 地 排列 。 如 果 没 有 这 条 语句 ， 数 字 
就 不 能 对 齐 。 


6 使 用 谈 套 循环 时 ， 对 循环 索引 变量 要 
特别 小 心 ， 以 免 将 相同 的 变量 用 于 不 同 循 环 。 
在 大 多 数 情 况 下 ， 每 个 循环 都 需要 自己 的 控 


制 变量 。 


可 根据 需要 在 循环 中 谱 套 任意 数量 的 
循环 ， 但 这 样 做 将 导致 代码 的 复杂 度 激增 。 


6 前 面 说 过 ， 如 果 你 在 谈 套 循环 中 使 用 
break 或 , continue，break 将 只 跳出 当前 循环 ， 
而 continue 只 进入 当前 循环 的 下 一 次 迭代 。 
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4 
to 


函数 是 一 大 块 可 重用 的 代码 。 它 是 有 名 
称 的 代码 块 ， 接 受 输入 、 提 供 输出 并 可 存储 
在 文件 中 供 以 后 使 用 。 几 乎 任何 Python 代码 
都 可 放 在 函数 中 。 


Python 为 函数 提供 了 强大 支持 。 例 如 ， 
它 提供 了 很 多 给 函数 传递 数据 的 方式 ; 它 还 
允许 在 函数 中 包含 文档 字符 串 ， 让 你 或 其 他 
程序 员 能 够 获悉 函数 的 工作 原理 。 


要 彻底 搞 懂 函 数 ， 需 要 学 习 大 量 细 市。 
通过 实践 ， 这 些 细节 将 很 快 融入 你 的 脑海 中 ， 
因此 请 务必 尝试 本 章 的 示例 。 


效 


本 章 内 容 

口 调用 函数 

口 定义 函数 

口 变量 作用 域 
口 使 用 main 函数 


口 函数 参数 


口 模块 


5.1 调用 函数 


在 本 书 前 面 ， 我 们 一 直 在 调用 函数 ， 下 
面 花 点 时 间 更 详细 地 研究 一 下 函数 调用 。 


请 看 内 置 函 数 pow(x，y) , 它 计 算 x ** y， 
即 x 的 y 次 方 : 


>>> pow(2，5) 


32 


其 中 ，pow 是 函数 名 ，2 和 5 是 传递 给 pow 
的 实 参 。32 是 返回 值 ， 因 此 我 们 说 pow(2，5) 
返回 32。 图 5-1 概述 了 函数 调用 。 当 你 在 表 
达 式 中 调用 函数 时 ，Python 将 函数 调用 替换 
为 其 返回 值 ， 例 如 ， 表 达 式 pow(2，5) + 8 与 
32 + 8 等 价 ， 结 果 为 40。 


即便 函数 不 接受 任何 输入 ( 即 没 有 参数 )， 
也 必须 在 函数 名 后 添加 圆 括 号 (): 


>>> dir() 
['_ builtins ',' doc ',' name ', 
'__package _'] 


() 让 Python 执行 指定 的 函数 ， 如 果 省 略 


()， 输 出 将 如 下 : 


>>> dir 


<built-in function dir> 


省 略 了 () 时 ，Python 不 执行 函数 ， 而 告 
诉 你 dir 指向 一 个 函数 。 


pow 


5-1 可 将 函数 视 为 接受 输入 (这 里 为 2 和 5) 
并 返回 输出 ( 这 里 为 32 ) 的 黑 盒 ,这 通常 很 有 帮助 。 
从 调用 函数 pow 的 程序 员 的 角度 看 ， 没 有 获悉 pow 
内 部 结构 的 简单 方式 。 我 们 只 知道 文档 提供 的 信息 ， 
还 是 就 是 调用 函数 时 它 做 什么 


计算 蛙 

pow(x，y) 与 x ## y 等 价 。 你 可 能 注 
意 到 了 ， 在 Python 中 ，pow(0，0) (还 有 0 
#k 0 ) 的 值 为 1， 这 一 点 一 直 存 在 争议 。 有 
些 数 学 家 认为 ，pow(0，0) 的 值 应 该 不 确 
定 或 未 定义 ; 但 其 他 一 些 数学 家 认为 ， 将 
pow(0，0) 定义 为 1 更 合乎 逻辑 。Python 显 
然 支持 后 一 种 观点 。 
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5.1.1 不 返回 值 的 函数 


有 些 函 数 (如 print ) 不 返回 值 。 请 看 下 
述 代码 : 


>>> print('hello') 
hello 

>>> x = print('hello') 
hello 

>3%X 

>>> print(x) 


None 


这 里 将 特殊 值 None 赋 给 了 变量 x。None 
表明 “无 返回 值 ”*: 它 既 不 是 字符 串 ， 也 不 
是 数字 ， 因 此 你 不 能 用 它 来 做 任何 有 意义 的 
计算 口 


5.1.2 ”给 函数 名 赋值 


你 必须 小 心 ， 以 避免 无 意 间 让 内 置 函 数 
名 指向 其 他 函数 或 值 。 不 幸 的 是 ，Python 并 
不 会 阻止 你 编写 类 似 下 面 的 代码 : 


>>> dir = 3 

>>> dir 

3 

>>> dir() 

Traceback (most recent call last): 
File "<pyshell#28>", line 1, in <module> 
dir() 


TypeError: 'int' object is not callable 

这 里 让 dir 指向 了 数字 3， 导 致 你 再 也 
无 法 访问 dir 原来 指向 的 函数 ! 要 恢复 原样 ， 
需要 重启 Python 。 
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5.2 ”定义 函数 


下 面 将 注意 力 转向 创建 自己 的 函数 。 做 
为 一 个 例子 星 们 米 丹 号 一 个 志 估 加 而 黎 的 
函数 。 你 应 该 还 记得 ， 圆 面积 为 pi 乘 以 半径 
的 平方 。 pa we 文 种 计算 的 Python 
函数 : 


# area.py 
import math 
def area(radius): 
""" Returns the area of a circle 
with the given radius. 
For example: 
>>> area(5.5) 


95.033177771091246 


return math.pi * radius ** 2 


将 这 ec tmnt id 
(area.py 是 个 合适 的 文件 名 )， 再 在 IDLE 编 
辑 器 中 打开 ， 并 按 F5 运行 它 。 如 果 输 入 无 
误 , 将 出 现 一 个 提示 符 , 但 除 此 之 外 别 无 他 物 ， 
这 是 因为 你 必须 调用 函数 ， 它 才 会 执行 。 要 
调用 这 个 函数 ， 只 需 输 入 函数 名 以 及 用 圆 括 
号 括 起 的 半径 : 


>>> area(1) 
3.1415926535897931 

>>> area(5.5) 
95.033177771091246 

>>> 2 * (area(3) + area(4)) 


157.07963267948966 


可 以 像 调用 其 他 函数 一 样 调用 函数 area， 
差别 在 于 函数 area 是 你 编写 的 ， 因 此 你 对 它 
做 什么 及 如 何 做 有 控制 权 。 


与 变量 名 一 样 ， 函 数 名 也 只 能 包含 字 
母 、 数 字 和 下 划 线 _， 且 不 能 以 数字 打头 。 


一 般 而 言 ， 应 给 函数 指定 一 个 指出 其 
用 途 的 简单 名 称 。 函 数 名 不 应 太 长 ， 也 不 
应 太 短 。 人 倘若 你 为 函数 选择 有 益 的 名 称 ， 
其 他 阅读 你 的 代码 或 使 用 你 的 函数 的 程序 
员 (也 包括 几 个 月 后 的 你 ! ) 将 感激 不 尽 。 
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一 种 格式 约定 

Python 文档 字符 串通 常 遵循 一 种 标准 
格式 约定 : 用 三 引号 标识 文档 字符 串 的 开 
始 和 结束 位 置 第 1 行 是 函数 的 简要 描述 ， 
对 程序 员 很 有 帮助 ; 接 下 来 是 详情 和 示例 。 


文档 字符 串 的 其 他 好 处 
与 内 置 函数 一 样 ， 你 也 可 轻松 地 查看 
自己 编写 的 函数 的 文档 字符 串 ， 如 下 所 示 : 


>>> print(area. doc ) 


Returns the area of a circle with the 
given radius. 


For example: 
>>> area(5.5) 


95.033177771091246 


正如 你 将 看 到 的 ， 当 你 在 IDLE 编辑 
器 中 调用 area 时 ，IDLE 将 自动 读 取 该 函 
数 的 文档 字符 串 ， 并 将 其 作为 工具 提示 显 
示 出 来 。 


Python 还 有 一 个 很 有 用 的 工具 一 一 
doctest， 可 用 于 自动 运行 文档 字符 串 中 的 
Python 示例 代码 。 这 是 一 种 不 错 的 代码 测试 
方式 ,还 可 帮助 确保 文档 准确 地 描绘 了 函数 。 
本 书 不 详细 介绍 doctest， 但 它 易 于 使 用 且 
非常 实用 ， 更 详细 的 信息 请 参阅 http://docs. 
python.org/3/library/doctest.html。 


函数 的 组 成 部 分 

来 看 看 函数 area 的 各 个 组 成 部 分 。 第 1 
行 ( 以 def 打头 的 那 行 ) 被 称 为 函数 头 ; 函 
数 头 后 面 所 有 缩 进 的 代码 被 称 为 函数 体 。 


函数 头 总 是 以 关键 字 def ( definition 的 缩 
写 ) 打头 ， 接 下 来 是 一 个 空格 ， 然 后 是 函数 
名 (这 里 为 area )。 函 数 命名 规则 与 变量 命名 
规则 相同 。 


函数 名 后 面 是 参数 列表 。 这 是 一 个 变量 
列表 ， 其 中 的 变量 指向 函数 的 输入 。 函 数 只 
有 一 项 输入 一 一 radius, 但 可 以 有 任意 数量 的 
输入 。 如 果 函 数 没 有 输入 ， 参 数列 表 将 只 包 
含 圆 括号 ()。 


最 后 ， 与 循环 和 诈 语 名 一样， 函数 头 也 


函数 头 后 面 是 可 选 的 文档 字符 串 。 文 档 
字符 串 简要 地 描绘 了 函数 的 功能 ， 可 能 包含 
示例 和 其 他 有 益 的 信息 。 虽 然 文档 字符 串 是 
可 选 的， 提供 它们 几乎 总 是 一 个 不 错 的 主意 : 
当 你 编写 大 量 函 数 时 ， 很 容易 忘记 它们 的 功 
能 和 工作 原理 ， 而 写 得 好 的 文档 字符 串 可 很 
好 地 提醒 你 。 


文档 字符 囊 后 面 是 函数 体 ， 这 是 一 个 缩 
进 的 代码 块 ， 完 成 了 你 需要 完成 的 工作 。 在 
这 个 代码 块 中 ， 可 使 用 函数 头 中 的 变量 。 


最 后 ， 函 数 应 使 用 关键 字 return 返回 一 
个 值 。return 语句 执行 时 ，Python 跳出 函数 
并 返回 到 调用 这 个 函数 的 地 方 。 
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在 函数 area 中 ，return 语句 是 最 后 一 行 
代码 ， 它 返回 使 用 标准 公式 计算 得 到 的 圆 面 
积 。 注 意 到 它 在 计算 时 使 用 了 参数 radius ， 
这 个 参数 的 值 是 在 调用 函数 area 时 设置 的 。 


return 语句 通常 是 函数 中 最 后 被 执行 的 
代码 (唯一 的 例外 是 ， 函 数 因 本 书后 面 将 讨 
论 的 异常 而 意外 终止 )。 你 可 将 return 语句 放 
在 函数 体 的 任何 地 方 ， 但 通常 放 在 函数 未 尾 。 


句 ， 例 如 : 


函数 并 非 必须 包含 return 语 


# hello.py 
def say_hello to(name): 


""" Prints a hello message. 


cap_name = name.capitalize() 


print('Hello ' + cap name + ', how are you?') 


如 果 孔 数 没 有 包含 return 语句 ，Python 
将 认为 它 以 下 述 代码 行 结 


return None 


特殊 值 None 用 于 指出 孔 数 不 返回 值 。 这 
很 常见 : et tl 
的 任务 ， 如 在 屏幕 上 打印 输出 。 


术语 说 明 

除 返回 值 外 ， 函 数 以 其 他 任何 方式 所 
做 的 修改 都 被 称 为 副作用 ( side effect ); 打 
印 到 屏幕 、 写 入 文件 和 下 载 网 页 都 属于 副 
作用 。 


有 一 种 名 为 函数 式 编程 的 编程 风格 ， 
其 特征 是 几乎 消除 了 副作用 。 在 函数 式 
编程 中 ， 你 只 能 通过 返回 值 来 完成 修改 。 
Python 为 函数 式 编程 提供 了 强 有 力 的 支持 ， 
包含 在 函数 中 定义 函数 以 及 将 函数 作为 值 
传递 给 其 他 函数 。 使 用 正确 的 情况 下 ， 函 
数 式 编程 是 非常 优雅 而 又 强大 的 程序 编写 
2 Be 

虽然 本 书 不 会 详细 介绍 函数 式 编程 ， 
但 尽 可 能 避免 函数 带 来 副作用 乃 明 智之 选 。 
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5.3 变量 的 作用 域 


函数 带 来 的 一 个 重要 问题 是 作用 域 。 变 
量 的 作用 域 指 的 是 它 在 程序 的 哪些 地 方 可 访 
问 或 可 见 。 请 看 下 面 两 个 函数 : 


# local.py 
import math 
def dist(x, y, a, b): 
Ss= (Xx-a)**2+(y-b)**2 
return math.sqrt(s) 
def rect area(x, y, a, b): 
width = abs(x - a) 
height = abs(y - b) 
return width * height 


首次 赋值 发 生 在 函数 内 的 变量 被 称 为 局 
部 变量 。 函 数 dist 有 一 个 局 部 变量 一 一 s， 而 
函数 rect_area 有 两 个 局 部 变量 一 一 width 和 
height。 


函数 的 参数 也 被 视 为 局 部 变量 ， 因 此 
dist 总 共有 5 个 局 部 变量 一 一 x、y、a、b 和， 
而 函数 rect_area 总 共有 6 个 局 部 变量 。 注 
意 到 变量 x、y、a 和 b 出 现在 这 两 个 函数 中 ， 
但 它们 通常 指向 不 同 的 值 。 


局 部 变量 只 能 在 其 所 属 函 数 中 使 用 ， 这 


局 部 变量 。 


函数 结束 时 ， 其 局 部 变量 被 自动 删除 。 
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全 局 变量 

在 函数 外 面 声明 的 变量 称 为 全 局 变量 ， 
程序 中 的 任何 函数 或 代码 都 可 读 取 它 。 然 而 ， 
在 函数 中 给 全 局 变量 重复 赋值 时 需要 特别 小 
心 。 请 看 下 面 的 代码 : 


# global error.py 
name = “Jack' 
def say_hello(): 
print('Hello ' + name + '!') 
def change name(new_ name): 


name = new_name 


第 一 个 name 变量 是 全 局 变量 ， 因 为 它 是 
在 函数 外 面 声 明 的 。 函 数 say_hello() 读 取 变 
量 name 的 值 ， 并 将 其 打印 到 屏幕 上 ， 这 与 你 
预期 的 一 致 : 


>>> say_hello() 
Hello Jack! 


然而 ， 调 用 change_name 时 结果 并 不 符合 
预期 : 


>>> change_name('Piper') 
>>> say_hello() 
Hello Jack! 


全 局 变量 name 的 值 并 没有 变 ， 依 然 


| 
全 


'Jack'。 问 题 在 于 Python 将 函数 change_name 
中 的 变量 name 视 为 局 部 变量 ， 因 此 修改 的 并 


非 全 局 变量 name。 


要 访问 全 局 变量 ， 必 须 使 用 关键 字 global: 


# global correct.py 
name = 'Jack’ 
def say_hello(): 
print('Hello ' + name + '!') 
def change name(new name): 
global name 


name = new_name 


这 样 结果 将 截然 不 同 ， 两 个 函数 的 行为 


都 符合 预期 : 


>>> say_hello() 

Hello Jack! 

>>> change_name('Piper') 
>>> say_hello() 

Hello Piper! 
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其 他 语言 中 的 main 函数 5.4 使 用 main 函数 
使 用 main 函数 的 做 法 非常 普遍 ， 有 些 在 你 编写 的 任何 Python 程序 中 ， 通 常 
编程 语言 ( 最 著名 的 是 C、Ct+ 和 Java) ”都 至 少 应 该 使 用 一 个 函数 : main()。 根 据 约 
还 要 求 必须 使 用 main 函数 。 但 在 Python 中 ， 定 ，main() 函数 被 认为 是 程序 的 起 点 。 例 如 ， 
main 只 是 一 种 约定 ， 完 全 是 可 选 的 。 编写 前 一 章 的 密码 检查 程序 时 ， 可 使 用 main 
函数 ， 


# password2.py 
def main(): 
pwd = input('What is the password? ') 
if pwd == 'apple’': 
print('Logging on ...') 
else: 
print('Incorrect password.') 


print('All done!') 


注意 到 所 有 代码 都 位 于 函数 头 main 后 面 ， 
并 缩 进 了 。 


在 IDLE 中 运行 password2.py 时 ， 什 么 都 
不 会 发 生 ， 而 只 是 出 现 一 个 提示 符 。 你 必须 
输入 main() 来 执行 其 代码 。 


使 用 main 函数 的 优点 是 ， 可 更 轻松 地 反 
复 运行 程序 ， 还 可 传递 输入 值 。 
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5.5 函数 的 参数 


参数 用 于 向 函数 传递 数据 ，Python 支持 
多 种 参数 。 


5.5.1 按 引 用 传递 

向 函数 传递 参数 时 ，Python 采用 按 引 用 
传递 的 方式 。 这 意味 着 当 你 传递 参数 时 ， 函 
数 将 使 用 新 变量 名 来 引用 原始 值 。 例 如 ， 请 
看 下 面 这 个 简单 的 程序 : 


# reference.py 
def add(a, b): 
returna+b 
启动 IDLE 的 交互 式 命令 行 ， 并 这 样 做 : 
>>> x,y = 3, 4 
>>> add(x, y) 
7 


在 第 1 行 设置 x 和 yy 后， 内 存 类 似 于 图 
5-2 所 示 。 当 调用 add(x,y) 时 ，Python 创建 
两 个 新 变量 一 一 a 和 b， 它 们 分 别 指向 x 和 y 
的 值 ， 如 图 5-3 所 示 。 按 排列 顺序 进行 赋值 ， 
因此 a 指向 x， 因 为 x 是 第 一 个 实 参 。 注 意 到 
没有 复制 实 参 的 值 ， 而 只 是 给 它们 指定 新 名 
称 ， 而 函数 将 使 用 这 些 新 名 称 来 引用 它们 。 


将 a 和 b 相 加 后 ,函数 返回 ， 而 a 和 b 
被 自动 删除 。 在 整个 函数 调用 过 程 中 , x 和 y 


未 受 影响 。 


X >3< a 

y > < b 
5-3 刚 调 用 add(x,y) 后 的 内 存 状态 : a 和 b 分 
别 指向 x 和 y 指向 的 值 


按 值 传递 

有 些 编程 语言 (如 C++) 可 按 值 传 
递 参 数 。 按 值 传 递 参数 时 ， 将 创建 其 找 
贝 ， 并 将 该 拷贝 传递 给 函数 。 如 果 传 递 的 
值 很 大 ， 复 制 可 能 消耗 大 量 时 间 和 内 存 。 
Python 不 支持 按 值 传递 。 
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5.5.2 一 个 重要 示例 
m—— 5 x | 
按 引 用 传递 简单 而 高 效 ,但 有 些 事 情 它 
| 做 不 了 。 例如 ,请 看 下 面 这 个 名 不 副 实 的 函数 : 
1 
# reference.py 
5-4 在 函数 调用 set1(m) 中 将 工 赋 给 x 后 ，m def set1(X): 
并 没 变 ， 依然 指 向 原来 的 值 5， 但 局 部 变量 x 确实 x=1 


被 设置 成 了 1 
函数 set1 想 将 传 入 的 变量 的 值 设置 为 1， 
但 如 果 你 尝试 运行 它 ， 结 果 并 不 符合 预期 : 
>>>m=5 


>>> set1(m) 


>>> m 


5 
m 的 值 根 本 没 变 ， 太 令 人 意外 了 。 这 都 是 E 

按 引用 传递 导致 的 。 为 帮助 理解 ， 将 这 个 示 

例 分 解 成 下 面 几 步 : 


1. 将 5 赋 给 m。 


2. 调用 set1(m): 将 m 的 值 赋 给 x， 这 样 
m 和 x 都 指向 5。 


3. 将 1 赋 给 x， 结果 如 图 5-4 所 示 。 
4. 函数 set1 结束 后 ，x 被 删除 。 


在 函数 set1 中 ， 根 本 不 能 访问 变量 m， 
因此 无 法 修改 它 指向 的 值 。 


5.5 函数 的 参数 77 
图 灵 社区 会 员 cindy282694 专 享 尊重 版 权 


5.5.3 ”默认 值 


给 参数 指定 默认 值 通常 很 有 帮助 。 例 如 ， 
在 下 面 的 函数 中 ， 给 参数 greeting 指定 了 默 
认 值 "Hel1o" : 


# greetings.py 
def greet(name, greeting = 'Hello'): 


print(greeting, name + '!') 


这 让 你 能 够 以 两 种 不 同 的 方式 调用 函数 


greet : 


>>> greet( "Bob ' ) 
Hello Bob! 
>>> greet('Bob', 'Good morning') 


Good morning Bob! 


默认 参数 很 方便 ， 在 Python 中 相当 
常见 。 


全 马 数 可 根据 需要 使 用 任意 数量 的 默认 
和 参数， 但 带 默 认 值 的 参数 不 能 位 于 没有 默认 
值 的 参数 前 面 。 


辆 国 ”有关 默 认 参 数 的 一 个 要 点 是 ， 只 在 第 
一 次 调用 函数 时 给 默认 参数 赋值 。 在 复杂 的 
程序 中 ， 这 可 能 成 为 微妙 bug 的 根源 ， 因 此 
牢记 这 一 点 很 有 帮助 。 
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5.5.4 ”关键 字 参 数 


在 Python 中 ， 男 一 种 很 有 用 的 参数 指定 
方式 是 使 用 关键 字 。 例 如 : 


# shopping.py 
def shop(where = 'store', 
what = 'pasta', 
howmuch = '10 pounds'): 


print('I want you to go to the', 
» where) 


print('and buy', howmuch, "of ， 
» what + '.') 


调用 使 用 关键 字 参 数 的 函数 时 ， 以 param 
= value 的 方式 传递 数据 。 例 如 : 


>>> shop() 

I want you to go to the store 
and buy 10 pounds of pasta. 
>>> shop(what = 'towels') 

I want you to go to the store 


and buy 10 pounds of towels. 


>>> shop(howmuch = "a ton', what = 'towels') 
I want you to go to the store 
and buy a ton of towels. 


>>> shop(howmuch = "a ton', what = 'towels', 
» where = "bakery ) 


I want you to go to the bakery 


and buy a ton of towels 


关键 字 参 数 有 两 大 好 处 。 首 先 ， 它 们 清 
晰 地 指出 了 参数 值 ， 有 助 于 提高 程序 的 可 读 
性 ; 其 次 ， 关 键 字 参 数 的 顺序 无 关 紧 要 。 对 
于 包含 大 量 参数 的 函数 来 说 ， 这 两 点 都 很 有 
帮助 ， 因 为 很 难 记 住 这些 函 数 的 参数 的 顺序 
和 含义 。 
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5.6 ”模块 


模块 是 一 系列 相关 的 函数 和 变量 。 


5.6.1 创建 Python 模块 

要 创建 模块 ， 可 创建 一 个 .py 文件 ， 在 其 
中 包含 用 于 完成 任务 的 函数 。 例 如 ,下面 是 
一 个 简单 的 模块 ， 用 于 在 屏幕 上 打印 形状 : 


# shapes.py 
"""A collection of functions 


for printing basic shapes. 


CHAR = '*' 
def rectangle(height, width): 
""" Prints a rectangle. """ 
for row in range(height): 
for col in range(width): 
print(CHAR, end = '') 
print() 
def square(side): 
""" Pprints a square. "" 
rectangle(side, side) 
def triangle(height): 
""" Prints a right triangle. """ 
for row in range(height): 
for col in range(1, row + 2): 
print(CHAR, end = '') 
print() 


模块 与 常规 Python 程序 之 间 唯 一 的 差别 
是 用 途 不 同 : 模块 是 一 个 由 函数 组 成 的 工具 
箱 ， 用 于 编写 其 他 程序 。 因 此 ， 模 块 通常 没 
有 main() 函数 。 
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要 使 用 模块 ， 只 需 导 入 它 即 可 。 例 如 : 


>>> import shapes 
>>> dir(shapes) 
[CHAR "builtins "doc 
»'_ file ', ' name ', '_ package _'， 


» 'rectangle', 'square', 'triangle'] 
>>> print(shapes. doc ) 
A collection of functions 
for printing basic shapes. 
>>> shapes.CHAR 
‘ik! 
>>> shapes.square(5) 
六 六 六 六 六 
六 六 六 六 六 


六 六 六 六 六 


六 六 六 六 六 

六 六 六 六 六 

>>> shapes.triangle(3) 
米 

炒米 


炒米 米 


你 还 可 导入 模块 的 所 有 内 容 : 


>>> from shapes import * 


>>> rectangle(3, 8) 


六 六 六 六 六 六 六 六 
六 六 六 六 六 六 六 六 


炒米 炒米 炒米 炒米 
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5.6.2 ”名 称 空间 


对 于 模块 ， 很 有 用 的 一 点 是 它们 形成 名 
称 空间 。 名 称 空间 基本 上 就 是 一 组 独特 的 变 
量 名 和 函数 名 。 要 让 模块 中 的 名 称 在 模块 外 
面 可 见 ， 你 必须 使 用 import 语句 。 


为 了 了 解 这 为 何 很 重要 ， 我 们 假设 Jack 
和 Sophie 合作 开发 一 个 大 型 编程 项 目 。Jack 
住 在 西海 岸 ， 而 Sophie 住 在 东海 岸 。 他 们 
达成 了 一 致 ，Jack 将 其 所 有 代码 都 放 在 模块 
jack.py 中 ，Sophie 将 其 所 有 代码 都 放 在 模 
块 sophie.py 中 。 他 们 各 自 独立 地 工作 ， 最 终 
都 编写 了 哨 数 save file(fname)， 但 这 两 个 
函数 只 是 函数 头 相同 ， 功 能 截然 不 同 。 这 两 
个 函数 位 于 不 同 的 模块 ， 即 便 同 名 也 没有 关 
系 ， 因 为 它们 位 于 不 同 的 名 称 空间 。Jack 编 
写 的 函数 的 全 名 为 jack.save_file(fname)， 
而 Sophie 编写 的 函数 的 全 名 为 sophie. save_ 
file(fname)。 


模块 可 避免 名 称 冲 突 ， 让 程序 员 能 够 独 
立地 进行 开发 。 即 便 你 不 与 其 他 程序 员 合 作 ， 
名 称 冲 突 也 是 个 恼人 的 问题 ， 在 程序 很 大 很 

复杂 时 尤其 如 此 。 


当然 ， 即 便 使 用 了 模块 ， 像 下 面 这 样 做 
依然 会 导致 名 称 冲 突 : 


>>> from jack import * 


>>> from sophie import * 


这 种 import 语句 将 每 个 模块 的 所 有 内 容 
都 加 入 到 当前 名 称 空间 ， 将 覆盖 其 他 同名 的 
内 容 。 因 此 ， 在 较 大 的 程序 中 ， 明 智 的 做 法 
是 不 使 用 from ... import * 语句 。 


Python 之 禅 
要 查看 一 个 有 趣 的 Python 复活 节 彩 有 蛋 ， 
可 尝试 从 交互 式 命令 行 导入 模块 this: 


>>> import this 
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rm 


字 付 串 


在 Python 中 ， 字 符 串 是 除数 字 外 最 重要 
的 数据 类 型 。 字 符 串 无 处 不 在 : 将 字符 串 打 本 章 内 容 

印 到 屏 右 ;从 用 户 那 里 读 取 字符 串 ， 正 如 你 | 主神 弟 过 到 
将 在 第 8 章 看 到 的 ， 文 件 通常 被 视 为 大 型 字 
符 串 。 可 将 万 维 网 视 为 一 个 网 页 集合 ， 而 这 D 字符 
些 网 页 大 部 分 是 由 文本 组 成 的 。 


口 字符 串 切片 
字符 串 是 一 种 聚合 数据 结构 ， 这 让 我 们 
口 TY 字 和 名 > 
有 机 会 初探 索引 和 切片 一 用 于 从 字符 串 中 人 
提取 子 串 的 方法 。 口 正则 表达 式 


本 章 还 将 简要 地 介绍 Python 正则 表达 式 
库 ， 这 是 一 种 设计 来 用 于 处 理 字 符 串 的 微型 
语言 ， 但 动力 强劲 。 


6.1 字符 串 索 引 


第 2 音 介 绍 过 字符 早 ， 如 果 你 要 复习 字 
符 串 基 本 知识 ， 可 回 过 头 去 阅读 相关 内 容 。 


处 理 ese 
个 字符 。 例 如 ， 假 设 你 知道 s 是 一 个 字符 串 ， 
ee 


索引 : 


>>> s = 'apple’ 


>>> s[0] 


Python 使 用 方 括号 来 标识 字符 串 索 引 : 
方 括号 内 的 数字 指出 了 要 获取 哪个 字符 ， 如 图 
6-1 所 示 。 在 Python 中 ， 最 小 的 字符 串 索引 总 
是 0， 而 最 大 的 索引 总 是 比 字 符 串 长 度 小 1。 


因此 ,如 果 s 指 问 一 个 长 度 为 n 的 字符 串 ， 
则 s[o] 为 第 一 个 字符 ，s[1] 为 第 二 个 字符 ， 
s[2] 为 第 三 个 字符 ， 依 此 类 推 。s[n-1] 为 最 
后 一 个 字符 。 


S 0 1 2 4 
~a pple 
8S[ A | Ng 


图 6-1 字符 串 'apple' 的 索引 值 ， 方 括号 索引 表 
示 法 用 于 访问 字符 串 的 各 个 字符 


为 何 从 和 零 开始 

Python 索引 从 零 开始 ， 初 学 者 常常 觉 

得 怪 怪 的 。 要 习惯 这 一 点 ， 确 实 需要 时 间 。 

它 还 可 能 导致 困扰 众多 程序 员 的 “ 差 一 错 
误 ”。 这 样 想 对 理解 它 很 有 帮助 : 索引 值 
用 于 测量 与 字符 串 第 一 个 字符 相隔 的 距离 ， 
就 像 一 把 尺子 (其 刻度 也 是 从 零 开 始 )。 这 
让 有 些 索 引 计算 更 简单 ,也 与 函数 %( 求 余 ) 
一 致 。% 经 常用 于 索引 计算 ， 自 然 也 可 能 
返回 0。 


六 > 庆生 


囊 
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Ss[1] S[2] Sr[3] SI[4] 
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图 6-2 ”Python 字符 串 有 正 索引 和 负 索 引 ; 实际 上 ， 


程序 员 通 常 使 用 最 方便 的 索引 


如 果 索 引 超出 了 字符 串 未 尾 , 将 导致 “ 超 
出 范围 ”错误 : 


>>> s[5] 

Traceback (most recent call last): 
File "<pyshell#6>", line 1, in <module> 
s[5] 


IndexError: string index out of range 


6.1.1 负数 索引 

假设 你 要 访问 s 的 最 后 一 个 字符 ， 而 不 
是 第 一 个 字符 。 为 此 ， 可 使 用 难看 的 表达 式 
s[len(s)-1]， 这 当然 可 行 , 但 相当 复杂 。 所 
幸 的 是 ， 在 访问 字符 串 末 尾 附近 的 字符 方面 ， 
Python 提供 了 一 种 更 便利 的 方式 : 负数 索引 。 
其 理念 是 ， 沿 从 右 向 左 的 方向 ， 用 负数 表示 
字符 串 中 字符 的 索引 : 


>>> s = 'apple’ 


>>> s[-1] 


>>> s[-2] 


>>> s[-3] 


>>> s[-4] 


>>> s[-5] 


因此 ， 字 符 串 的 最 后 一 个 字符 为 s[-1]。 
图 6-2 说 明了 负数 索引 的 工作 原理 。 
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6.1.2 ”使 用 for 循环 访问 字符 

如 果 需 要 依次 访问 字符 串 的 每 个 字符 ， 
for 循环 可 助 一 臂 之 力 。 例 如 ， 下 面 的 程序 计 
算 给 定 字 符 串 的 字符 编码 总 和 : 


# codesum.py 
def codesum1(s): 
""™ Returns the sums of the 


character codes of s. 


total = 0 
for c in s: 
total = total + ord(c) 


return total 


下 面 是 一 个 调用 示例 : 


>>> codesum1('Hi there!') 


778 


像 这 样 使 用 for 循环 时 ， 在 循环 的 每 次 
迭代 开头 ， 都 会 将 循环 变量 c 设置 为 s 中 的 
下 一 个 字符 。 使 用 索引 访问 s 中 字符 的 工作 
由 for 循环 自动 处 理 。 


下 面 是 另 一 种 实现 ， 它 使 用 了 常规 字符 
串 索 引 ， 请 将 其 与 codesum1 进行 比较 : 


def codesum2(s): 
"”" ”Returns the sums of the 
character codes of s. 
total = 0 
for i in range(len(s)): 
total = total + ord(s[i]) 


return total 


这 种 实现 的 结果 与 codesum1 相同 ， 但 更 
复杂 、 可 读 性 更 差 。 
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Unicode 的 崛起 

在 20 世纪 60 年 代 到 80 年 代 ， 最 流行 
的 字符 编码 方案 是 ASCII ( 美国 信息 交换 
标准 编码 )。 ASCII 比 Unicode 简单 得 多 ， 
但 存在 一 个 致命 缺陷 ， 那 就 是 只 能 表示 256 
个 字符 。 对 英语 、 法 语 和 其 他 几 种 类 似 的 
语言 来 说 ， 这 足够 了 ， 但 要 表示 其 他 语言 
中 众多 的 符号 和 字符 ， 这 远 远 不 够 。 例 如 ， 
可 能 出 现在 文本 文档 中 的 表意 中 文字 就 有 
当下 小 。 


Unicode 提供 了 一 个 大 得 多 的 字符 编码 
icode nn 
字母 为 ASCII 码 ， 因 此 如 果 你 只 处 理 英文 
字符 ， 几 乎 不 用 考虑 Unicode 的 细节 。 有 
关 Unicode 的 更 详细 信息 ， 请 参阅 其 主页 


Www.unicode.org。 


6.2 ”字符 

字符 串 由 字符 组 成 ， 而 字符 本 身 实际 上 
是 一 个 非常 复杂 的 问题 。 正 如 第 2 章 指 出 的 ， 
所 有 字符 都 有 对 应 的 字符 编码 ， 你 可 以 使 用 
函数 ord 来 获悉 : 


>>> ord('a') 
97 
>>> ord('b') 
98 
>>> ord('c') 


99 


给 定 字符 编码 ， 可 使 用 函数 chr 来 获悉 
对 应 的 字符 : 


>>> chr(97) 
>>> chr(98) 
'p' 

>>> chr(99) 


‘ce! 


字符 编码 是 根据 Unicode 分 配 的 ， 而 
Unicode 是 一 个 庞杂 的 编码 标准 ， 涵 盖 了 全 球 
各 种 语言 中 的 符号 和 字符 。 
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转 义 字符 

并 非 所 有 字符 都 有 可 视 的 标准 符号 。 例 
如 ， 换 行 字 符 、 回 车 字符 和 制 表 符 都 是 不 可 
见 的 ， 虽 然 它 们 带 来 的 效果 可 见 。 这 些 字符 
属于 空白 字符 一 一 在 印刷 页 面 上 显示 为 空白 。 


为 处 理 空白 字符 以 及 其 他 不 可 打印 的 字 
符 ，Python 使 用 一 种 特殊 表示 法 一 一 转 义 序 
列 〈 也 叫 转 义 字符 ) 表 6-1 列 出 了 最 常用 的 
转 义 字符 。 


要 在 字符 串 中 包含 反 斜 杜 、 单 引号 和 双 
引号 ， 通 常 需要 使 用 对 应 的 转 义 字符 。 例 如 : 


>>> print('\' and \" are quotes') 
”and " are quotes 

>>> print('\\ must be written \\\\') 
\ must be written \\ 


在 Python 中 ， 表 示 换 行 的 标准 方式 是 使 
用 字符 \n: 


>>> print('one\ntwo\nthree') 
one 
two 


three 


转 义 字符 是 单个 字符 ， 明 日 这 一 点 很 重 
要 。 为 让 Python 知道 下 一 个 字符 是 特殊 字符 ， 
必须 使 用 \， 但 在 计算 字符 串 的 长 度 时 ， 并 不 
将 \ 视 为 额外 的 字符 。 例 如 : 


>>> len('\\') 
入 
>>> len('a\nb\nc') 


5 


表 6-1 一 些 常见 的 转 义 字符 


字 符 含义 
\\ 反 斜 杠 
\ 单 引 号 
NW 双 引 号 
\n 换行 符 
\r 可 车 
\t 水 平 制 表 符 


行 尾 

在 表示 文本 行 末 尾 方面 ， 不 同 操作 系 
统 遵循 的 标准 也 不 同 。 例如，Windows 使 
用 \r\n 表示 行 尾 ，OS X 和 Linux 使 用 \n， 
而 OS 义 之 前 的 Mac 操作 系统 使 用 \T。 


大 多 数 优 秀 编辑 器 都 至 少 能 够 识别 \IT\ 
n 和 \n。 你 会 偶尔 遇 到 不 能 识别 行 尾 标 记 
的 程序 ( 如 Windows“ 记 事 本 ”)， 因 此 可 
能 出 现 这 样 的 情形 : 所 有 内 容 都 出 现在 一 
行 、 增 加 了 换行 或 每 行 末尾 都 有 ^M 字符 。 
避免 这 种 问题 的 最 简单 方式 是 ,使 用 能 正 
确 处 理 行 尾 标记 的 文本 编辑 器 。 
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6.3 字符 串 切 片 


在 Python 中 ， 可 使 用 切片 从 字符 串 中 提 
取 子 串 。 要 对 字符 串 执行 切片 操作 ， 可 指定 
两 个 索引 : 要 提取 的 第 一 个 字符 的 索引 ;要 
提取 的 最 后 一 个 字符 的 索引 加 1。 例 如 : 


>>> food = "apple pie’ 
>>> food[0:5] 

"apple" 

>>> food[6:9] 


'pie' 


用 于 切片 的 索引 与 用 于 访问 各 个 字符 的 
索引 相同 : 第 一 个 索引 总 是 为 零 ， 而 最 后 一 
个 索引 总 是 比 字 符 串 长 度 小 1。 一般 而 言 ， 
s[begin:end] 返回 从 索引 begin 到 end-1 的 
子 串 。 


请 注意 ， 如 果 s 是 一 个 字符 串 ， 则 要 访问 
索引 i 对 应 的 字符 ， 可 使 用 s[i] 或 s[i:i+1]。 
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6.3.1 获取 切片 的 捷径 

如 果 你 省 略 切片 的 起 始 索引 ，Python 将 
假定 它 为 零 ; 如 果 你 省 略 切片 的 终止 索引 ， 
Python 将 假设 你 要 提取 到 字符 串 末 尾 。 例 如 : 


>>> food = 'apple pie'" 
>>> food[:5] 

"apple" 

>>> food[6:] 

pie 

>>> food[:] 


"apple pie'" 


下 面 是 一 个 很 有 用 的 切片 示例 ， 这 个 函 
数 返回 文件 名 中 的 扩展 名 : 


# extension.py 
def get ext(fname): 
""" Returns the extension of file 
fname. 
dot = fname.rfind('.') 
if dot == -1: # fname 中 没有 
return '"' 


else: 


return fname[dot + 1:] 
下 面 演示 了 函数 get_ext 的 作用 : 


>>> get ext('hello.text') 
‘text" 
>>> get ext('pizza.py') 


py 
>>> get ext('pizza.old.py') 


py 
>>> get ext('pizza') 
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函数 get_ext 的 工作 原理 如 下 : 确定 最 右 
边 的 '… 的 索引 (因此 使 用 rfind 从 右 往 左 查 
找 ) 如 果 fname 不 包含 …， 则 返回 一 个 空 字 
符 串 ， 和 否则 返回 … 后面 的 所 有 字符 。 


6.3.2 ”使 用 负数 索引 的 切片 


执行 切片 操作 时 ， 也 可 使 用 负数 索引 ， 
虽然 这 更 难 仪 。 例 如 : 


>>> food = "apple pie’ 
>>> food[-9:-4] 
"apple" 

>>> food[:-4] 

"apple" 


>>> food[-3:0] 


>>> food[-3:] 


使 用 负数 索引 时 ， 这 样 做 通常 会 有 所 帮 
助 : 将 字符 串 写 到 纸 上 ， 再 标 出 每 个 字符 的 
正 索 引 和 负 索 引 ， 就 像 图 6-2 那样 。 虽 然 这 样 
做 确实 需要 多 用 一 两 分 钟 时 间 ， 但 可 以 很 好 
地 避免 常见 的 索引 错误 。 
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6.4 标准 字符 串 函 数 

Python 字符 串 自 带 了 大 量 很 有 用 的 函数 ， 
要 查看 所 有 这 些 函数 ， 可 调用 dir 并 将 参数 
指定 为 任何 字符 串 (如 dir('') )。 虽 然 没 有 
必要 准确 地 记 住所 有 这 些 函 数 的 功能 ， 但 最 
好 大 致 了 解 它们 的 功能 ， 这 样 才能 根据 需要 
使 用 它们 。 因 此 ， 本 节 将 分 门 别 类 地 介绍 字 
符 串 自 带 的 所 有 函数 。 


这 里 无 意 提 供 完整 的 参考 手册 : 对 一 些 
不 太 和 常用 的 参数 ， 将 省 略 不 表 ， 也 不 详细 介 
绍 每 个 函数 的 所 有 细节 。 要 更 详细 地 了 解 这 
些 函 数 ， 可 参阅 其 文档 字符 串 或 Python 在线 
文档 ( http://docs.python.org/3/ )。 


6.4.1 测试 函数 

首先 介绍 检测 字符 串 是 否 为 特定 格式 的 
函数 ， 它 们 组 成 了 一 个 最 大 的 字符 串 函数 组 。 
表 6-2 所 示 的 测试 函数 都 返回 True 或 False。 
测试 函数 有 时 也 叫 布尔 函数 或 谓词 。 


表 6-2 ”字符 串 测试 函数 
函 数 名 什么 情况 下 返回 True 
s.endswith(t) s 以 字符 串 t 结尾 
s.startswith(t) s 以 字符 串 t 打 头 
s.isalnum() s 只 包含 字母 或 数字 
s.isalpha() s 只 包含 字母 
s.isdecimal() s 只 包含 表示 十 进 制 数 字 的 字符 
s.isdigit() s 只 包含 数字 字符 
s.isidentifier()  s 是 合法 的 标识 符 
s.islower() s 只 包含 小 写字 母 
s.isnumeric() 只 包含 数字 
s.isprintable() s 只 包含 可 打印 字符 
s.isspace() s 只 包含 空白 字符 
s.istitle() s 是 个 大 小 写 符合 头衔 要 求 
( title-case ) 的 字符 串 

s.isupper() s 只 包含 大 写字 母 
tins s 包含 字符 串 t 
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表 6-3 ”字符 串 搜索 函数 6.4.2 ”搜索 函数 


3 类 ] G 一 AAA > 

本 各 二 让 一 如 表 6-3 所 示 ， 在 字符 串 中 查找 子 串 的 方 

sin 果 ; ， 则 返回 -1; 否 帆 、 口 
返回 t 在 s 中 的 起 始 位 轩 式 有 多 种 。 吧 数 index 和 find 之 间 的 差别 在 

s.rfind(t) ”与 find 相 同 , 但 从 右 往 左 搜索 于 没有 找到 指定 子 串 时 的 情形 。 例 如 : 


s.index(t) 与 find 相同， 但 如 果 在 s 中 找 不 到 t， 
则 引发 ValueError 异常 


>>> s = 'cheese' 


>>> s.index('eee') 


Traceback (most recent call last): 
File "<pyshell#2>", line 1, in <module> 
s.index('eee') 

ValueError: substring not found 

>>> s.find('eee') 


-1 


函数 index 引发 异常 ValueError, 第 9 章 
将 更 详细 地 介绍 异常 。 如 果 没 有 找到 指定 的 
子 串 ， 限 数 find 将 返回 -1。 


字符 串 搜 索 函 数 通 常 从 左 往 右 ( 从 开头 
往 末 尾 ) 搜索 , 但 以 rt 打头 的 函数 从 右 往 左 
搜索 。 例 如 : 


>>> 5 = “Cheese 
>>> s.find('e') 
之 

>>> s.rfind('e') 


5 


一 般 而 言 ， 函 数 find 和 index 返回 传 
入 字符 串 第 一 次 出 现时 的 起 始 位 置 索引 ， 而 
rfind 和 rindex 返回 传 和 字符 串 最 后 一 次 出 
现时 的 起 始 位 置 索引 。 
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6.4.3 ”改变 大 小 写 的 函数 

Python 提供 了 各 种 修改 字母 大 小 写 的 函 
数 ， 如 表 6-4 所 示 。 别 忘 了 ，Python 绝 不 会 修 
改 字 符 串 : 在 所 有 这 些 函 数 中 ，Python 都 创建 
并 返回 一 个 新 字符 串 。 我 们 谈论 字符 串 时 ， 常 
篆 让 人 觉得 字符 串 被 修改 ， 但 这 只 是 为 了 方便 
措 词 ， 并 不 意味 着 字符 串 真 的 被 修改 。 


6.4.4 设置 格式 的 函数 

表 6-5 列 出 了 设置 字符 串 格式 的 函数 ， 它 
们 让 你 能 够 美化 字符 串 ， 以 便 向 用 户 显示 或 
打印 到 文件 。 


字符 串 函 数 format 功能 非 党 强大， 包含 
用 于 设置 字符 串 格 式 的 微型 语言 。 要 使 用 函 
数 format ， 你 需要 给 它 提供 变量 或 值 ， 如 下 
例 所 示 : 


>>> '{0} likes {1}'.format('Jack', "ice cream ) 


'Jack likes ice cream' 


字符 串 中 的 {0} 和 {1} 引用 format 的 参 
数 : 它们 将 被 蔡 换 为 相应 字符 串 或 变量 的 值 。 
你 还 可 以 使 用 关键 字 参 数 的 名 称 : 


>>> '{who} {pet} has fleas' .format (pet = 
dog 

» who = “my ) 

"my dog has fleas 


这 些 示 例 演 示 了 format 的 最 基本 用 法 ， 
还 有 很 多 其 他 的 选项 ， 可 用 于 指定 字符 串 
间距 、 将 数字 转换 为 字符 串 等 。 所 有 细节 都 
可 在 Python 在 线 文 档 中 找到 ， 网 址 为 http:// 
docs.python.org/3/library/string.html#format- 


string-syntaxo 


表 6-4 改变 大 小 写 的 函数 


函 数 名 返回 的 字符 串 
s.capitalize() 将 s[0] 改 为 大 写 
s.lower() 让 s 的 所 有 字母 都 小 写 
s.upper() 让 s 的 所 有 字母 都 大 写 
s.swapcase() 将 小 写字 母 改 为 大 写 ， 并 将 大 写字 

母 改 为 小 写 
s.title() 让 s 的 大 小 写 符合 头衔 的 要 求 
表 6-5 设置 字符 串 格 式 的 函数 
函 数 名 返回 的 字符 串 


an 


.center(n, ch) 


s.ljust(n, ch) 


s.rjust(n, ch) 


s.format(vars) 


包含 n 个 字符 的 字符 串 ， 其 中 s 位 
于 中 央 ， 两 边 用 字符 ch 填充 
包含 n 个 字符 的 字符 串 ， 其 中 s 位 
于 左边 ， 右 边 用 字符 ch 填充 
包含 n 个 字符 的 字符 串 ， 其 中 s 位 
于 右边 ,左边 用 字符 ch 填充 

见 正文 
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表 6-6 “字符 串 剥 除 函数 6.4.5 和 剥 除 函 数 


泥 类 返回 的 字符 有 2z Ar ch N > 
i 剥 除 函数 用 于 删除 字符 串 开头 或 末尾 多 
s.strip(c s 开头 毛 训 | 际 Ee 2 三 Ss y 
ea 余 的 字符 ， 如 表 6-6 所 示 。 默 认 情 况 下 ， 将 
s.lstrip(ch) 从 s 开头 ( 左 端 ) 删除 所 有 包含 在 “” 剥 除 空白 字符 ; 如 果 指定 了 一 个 字符 串 参 数 ， 
字符 串 ch 中 的 字符 将 剥 除 该 字符 串 中 的 字符 ， 如 下 所 示 : 
s.rstrip(ch) 从 ss 末尾 ( 右 端 ) 删除 所 有 包含 在 
字符 串 ch 中 的 字符 >>> name = ' Gill Bates ' 


>>> name.1lstrip() 


表 6-7 字符 串 拆 分 函数 


an 


an 


an 


an 


an 


'Gill Bates ' 
函 数 名 返回 的 字符 串 >>> name.rstrip() 
.partition(t) 将 s 拆 分 为 三 个 字符 串 (head、t 和 
tail )， 其 中 head 为 七 前 面 的 子 串 ， 0 
而 tail 为 t 后 面 的 子 串 >>> name.strip() 
.rpartition(t) 与 partition 相同 , 但 从 s 的 右 端 "Gill Bates 
开始 搜索 >>> title = ' - - Happy Days!! - -"' 
.Split(t) 以 t 为 分 隔 符 ， 将 s 划分 成 一 系列 >>> title.strip() 
子 串 ， 并 返回 一 个 由 这 些 子 串 组 成 ia 
的 列表 和 
.rsplit(t) 与 split 相同 , 但 从 s 的 右 端 开始 > es i 
搜索 ”Happy Days!! 
.splitlines() ”返回 一 个 由 s 中 的 各 行 组 成 的 列表 >>> title.strip(' -') 
“Happy Days!!' 


6.4.6” 拆 分 函数 

拆 分 函数 将 字符 串 拆 分 成 多 个 子 串 ， 如 
表 6-7 所 示 。 函 数 partition 和 rpartition 将 
字符 串 拆 分 为 3 部 分 : 


>>> url = 'www.google.com' 
>>> url.partition('.') 


(www ， ， "google.com') 


>>> url.rpartition('.') 


('www.google', '.', "com' ) 


这 两 个 函数 总 是 返回 一 个 这 样 的 值 : 它 
由 3 个 字符 串 组 成 ,形式 为 (head，sep， 
tail)。 这 种 返回 值 为 元 组 ， 将 在 第 7 章 更 详 
细 地 介绍 。 
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国 数 split 以 指定 字符 串 为 分 隔 符 ， 将 表 6-8 字符 串 替 换 函 数 


字符 串 划 分 为 一 系列 子 串 ， 如 下 所 示 : 函 数 名 返回 的 字符 串 
s.replace(old, new) ”将 s 中 的 每 个 old 替换 为 new 
>>> url = 'Wwww.google.com' s.expandtabs(n) 将 s 中 的 每 个 制 表 符 蔡 换 为 n 个 
>>> url.split('.') 空格 


['www', 'google', 'com'] 

>>> story = 'A long time ago，a princess ate 
an apple.” 

>>> story.split() 

['A', 'long', 'time', 'ago,', 'a', 'princess', 


» 'ate', 'an', 'apple.'] 


函数 split 总 是 返回 一 个 字符 串 列 表 ; 
Python 列表 总 是 分 别 以 [和 ] 打头 和 结尾 ， 
并 用 逗号 分 隔 元 素 。 正 如 你 将 在 第 7 前 看 到 的 ， 
列表 和 元 组 很 像 ， 主 要 差别 在 于 列表 是 可 以 
修改 的 ， 而 元 组 是 常量 。 


6.4.7 ”替换 函数 

Python 字符 串 自 带 了 两 个 替换 函数 ， 如 
表 6-8 所 示 。 注 意 到 使 用 替换 函数 可 轻松 地 删 
除 字符 串 中 的 子 串 : 


>>> s = "up，up and away 
>>> s.replace('up', 'down') 
“down，down and away' 

>>> s.replace('up', '') 


' ， 
，and away 
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然而 ， 这 个 函数 不 是 很 灵活 ， 因 此 大 多 


XN 
[Ba 


6.4.8 其 他 函数 
最 后 ， 表 6-9 列 出 了 其 他 字符 串 函 数 。 
需要 将 一 组 字符 转换 为 另 一 组 字符 时 ， 
函数 translate 和 maketrans 很 实用 。 例 如 ， 
下 面 是 一 种 将 字符 串 转 换 为 “脑残 体 ”(1leet- 


函数 join 很 用， 它 将 一 系列 字符 串 拼 
接 起 来 ， 其 中 包含 分 隅 字符 串 ， 如 下 所 未 : 


speak ) 的 方式 : >>> ' '.join(['once'’, 'upon', 'a', 'time']) 
“once upon a time' 
>>> leet table = ''.maketrans ('EIOBT', 
, '31087') >>> '-'.join(['once', 'upon', 'a', 'time']) 
>>> "BE COOL. SPEAK LEET!'.translate onceaubonaast ine 
» (leet table) >>> ''.join(['once', 'upon', 'a', 'time']) 
'83 CooL. SP3AK L337!" “onceuponatime 


在 线 文档 ( http://docs.python.org/3/library/ 
stdtypes.html#str.maketrans ) 还 解释 了 如 何 替 
换 多 个 字符 。 函数 zfill 用 于 设置 数值 字符 
串 的 格式 : 


>>> '23' .zfil1(4) 


"0023 
>>> '-85' .zfil1(5) 


' -0085" 
表 6-9 其 他 字符 串 函 数 
函数 名 返回 的 值 
s.count(t) t 在 s 中 出 现 的 次 数 
s.encode() 设置 s 的 编码 ， 更 详细 的 信息 请 参阅 在 线 文档 ( http://docs.python.org/3/library/stdtypes. 
html#str.encode ) 
s.join(seq) 使 用 s 将 seq 中 的 字符 串 连 接 成 一 个 字符 串 


an 


.maketrans (old, new) 创建 一 个 转换 表 ， 用 于 将 o1d 中 的 字符 改 为 new 中 相应 的 字符 ; 请 注意 ，s 可 以 是 任何 
字符 串 ， 它 不 影响 返回 的 转换 表 


s.translate(table) 使 用 指定 转换 表 ( 使 用 maketrans 创建 的 ) 对 s 中 的 字符 进行 替换 
s.zfill(width) 在 s 左边 添加 足够 多 的 0， 让 字符 串 的 长 度 为 width 
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6.5 正则 表达 式 表 6-10 “一些 正则 表达 式 运算 符 


运 算 符 描述 的 字符 串 
虽然 Python 字符 串 提 供 了 众多 实用 的 郴 xy? 六 
数 ， 但 实际 处 理 字符 串 时 ， 常 常 需要 使 用 更 xly x、y 
强大 的 工具 。 x* ''、x、xx、xxx、xxxx 等 
X+ Xx、Xxx、xxx、xxxx 等 


有 鉴于 此 ， 程 序 员 开发 了 一 种 用 于 复杂 
字符 串 处 理 的 微型 语言 一 一 正则 表达 式 。 


实际 上 ， 正 则 表达 式 就 是 一 种 简练 描绘 
一 组 字符 串 的 方式 ， 可 用 于 高 效 地 执行 常见 
的 字符 串 处 理 任务 ， 如 匹配 、 分 拆 和 蔡 换 。 
本 节 介 绍 正则 表达 式 的 基本 概念 以 及 一 些 常 
用 的 运算 符 ( 如 表 6-10 所 示 )。 


6.5.1 简单 的 正则 表达 式 

来 看 字符 串 'cat' ， 它 表示 单个 字符 串 ， 
这 个 字符 串 由 字母 c、a 和 t 组 成 。 接 下 来 看 看 
整个 表达 式 'cats?'， 其 中 的 ?并 非 英 语 中 的 
问号 ， 而 是 一 个 正则 表达 式 运 算 符 ， 意思 是 它 
左边 的 那个 字符 是 可 选 的 。 因 此 ， 正 则 表达 式 
"cats? 描述 了 两 个 字符 串 : "cat 和 'cats'。 


另 一 个 正则 表达 式 运 算 符 是 |， 其 含义 
是 “或 者 ”。 例 如 ， 正 则 表达 式 'alblc' 描述 
了 三 个 字符 串 : "a'、'b' 和 'c'。 正 则 表达 式 
'a*' 描述 了 无 穷 个 字符 串 : ''、'a'、'aa'、 
'aaa' 、'aaaa' 、'aaaaa' 等 。 换 名 话说 ， "ax#' 
摘 述 的 是 由 零 或 更 多 个 'a' 组 成 的 字符 串 。 
正则 表达 式 'a+' 与 "ax' 相同 ， 但 排除 了 空 字 
符 串 ”。 
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最 后 ， 在 正则 表达 式 中 ， 可 使 用 圆 括 
号 来 指出 要 将 运算 符 用 于 那个 子囊 。 例 如 ， 
正则 表达 式 '(ha)+1' 描述 了 如 下 字符 串 : 
'ha!l'、'haha!'、'hahaha!' 等 ， 而 'ha+t!"' 描 
述 了 一 组 截然 不 同 的 字符 串 :'hal'、 
'haaal' 等 。 


"haal ` 、 


可 随意 混合 使 用 这 些 〈 以 及 其 他 ) 正则 
表达 式 运算 符 。 事 实证 明 ， 这 是 一 种 非常 实 
用 的 方式 ， 可 描述 众多 常见 的 字符 串 类 型 ， 
如 电话 号 码 和 电子 邮件 地 址 。 


6.5.2 ”使 用 正则 表达 式 匹 配 字符 串 
匹配 字符 串 是 正则 表达 式 的 一 种 常见 用 

途 。 例 如 ， 假 设 你 要 编写 一 个 程序 ， 要 求 用 

户 必 须 输入 done 或 quit 来 结束 程序 。 为 帮助 


识别 这 些 字符 串 ， 可 编写 一 个 类 似 于 下 面 的 
函数 : 
# allover.py 
def is done1(s): 
return s == 'done' or s == 'quit' 


使 用 正则 表达 式 时 ,行为 完全 与 此 相同 
的 函数 可 能 类 似 于 下 面 这 样 : 


# allover.py 
import re # 使 用 正则 表达 式 
def is done2(s): 


return re.match('done|quit', s)!= None 


在 这 个 新 版 本 中 ， 第 1 行 导 入 Python 的 
标准 正则 表达 式 库 。 为 匹配 正则 表达 式 , 使 
用 了 函数 re.match(regex，s)， 它 在 regex 与 
s 不 匹配 时 返回 None， 和 否则 返回 一 个 特殊 的 正 


则 表达 式 匹 配对 象 。 在 这 个 示例 中 ， 我 们 不 
关心 匹配 对 象 的 细节 ， 因 此 只 检查 返回 值 是 
和 否 为 None。 


在 这 样 的 简单 示例 中 ， 正 则 表达 式 版 本 
并 不 比 第 一 个 版 本 短 很 多 ， 也 不 比 第 一 个 版 
本 好 很 多 ; 实际 上 ，is_donel 可 能 更 好 ! 然 
而 ， 随 着 程序 越 来 越 大 、 越 来 越 复 杂 ， 正 则 
表达 式 的 优势 就 会 逐渐 显现 出 来 。 例 如 ， 假 
设 我 们 决定 再 添加 几 个 用 于 结束 程序 的 字 
符 串 。 对 于 正则 表达 式 版 本 中 ， 只 需 重 写 正 
则 表达 式 字 符 串 ， 如 改 为 'done|quit|over| 
finished|end|stop'; 然而 ， 要 对 第 一 个 版 本 
做 同样 的 修改 ， 需 要 为 每 个 新 增 的 字符 串 添 
加 or s==, 这 将 导致 代码 行 很 长 ,可 读 性 极 差 。 


举 一 个 更 复杂 的 例子 。 假 设 要 识别 去 
人 的 字符 串 : 开头 为 一 个 或 多 个 'ha' ,来 尾 


'hahaha!!'。 使 用 正则 表达 式 匹 配 这 些 字符 串 
很 容易 : 


# funny.py 
import re 
def is funny(s): 


return re.match('(ha)+!+', s)!= None 


注意 到 is_funny 与 is_done2 的 唯一 差别 
是 ,调用 函数 match 时 指定 的 正则 表达 式 不 同 。 
如 果 你 尝试 在 不 使 用 正则 表达 式 的 情况 下 编 
写 这 个 函数 ， 将 很 快 明白 ' (ha)+!+' 为 我 们 做 
了 多 少 工作 。 
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6.5.3 ”其 他 正则 表达 式 

这 里 只 涉及 正则 表达 式 的 一 些 皮 毛 : 
Python 库 re 规模 庞大 ， 其 中 有 大 量 正则 表达 
式 函 数 可 用 于 执行 字符 串 处 理 任务 ， 如 匹配 、 
分 拆 和 替换 ; 还 有 提高 常用 正则 表达 式 处 
理 速 度 的 技巧 ， 以 及 众多 匹配 常用 字符 的 捷 
径 。 模 块 re 的 文档 ( http://docs.python.org/3/ 
library/re.html ) 提供 了 其 他 一 些 示 例 。 
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数据 结构 


本 章 介绍 重要 的 数据 结构 概念 : 值 集合 
及 和 常用 的 函数 。Python 秉承 方便 程序 员 的 理 
念 ， 提 供 了 几 个 功能 强大 而 高 效 的 数据 结构 : 
元 组 、 列 表 、 字 典 和 集合 ， 程 序 员 可 根据 需 
要 组 合 使 用 它们 ， 以 创建 更 复杂 的 数据 结构 。 


前 一 童 讨论 了 字符 串 ， 可 将 其 视 为 只 存 
储 字符 序列 的 数据 结构 。 本 章 介 绍 的 数据 结 
构 并 非 只 能 存储 字符 ， 而 是 能 存储 几乎 任何 
数据 。 


在 Python 中 ， 两 个 主力 数据 结构 是 列表 
和 字典 。 列 表 按 顺序 存储 数据 ， 而 字典 像 小 
型 数据 库 ， 使 用 键 高 效 地 存储 和 检索 数据 。 


本 章 内 容 

口 type 命令 
口 序列 

口 元 组 

口 列表 

口 列表 函数 
口 列表 排序 
口 列表 解析 


口 字典 


口 集合 ( set ) 


在 有 些 情况 下 ， 需 要 检查 值 或 变量 的 数 
据 类 型 。 这 很 容易 ， 只 需 使 用 内 置 命令 type: 


>>> type(5) 

<class 'int'> 

>>> type(5.0) 
<class 'float'> 
>>> type('5') 
<class 'str'> 

>>> type(None) 
<class 'NoneType'> 
>>> type(print) 


<class 'builtin function or method'> 


注意 到 在 type 命令 的 输出 中 ,使 用 了 术 
语 类 (class )。 粗 略 地 说 ， 类 和 类 型 是 同义词 。 


type 命令 对 调试 很 有 帮助 。 例 如 ， 在 
Python 中 ， 经 常 需要 使 用 数据 集合 ， 但 不 知 
道 其 元 素 甚 至 容 需 本 身 的 数据 类 型 ， 通 过 使 
用 type， 可 获悉 Python 对 象 的 准确 类 型 。 
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顺序 很 重要 7.2 序列 


我 们 说 序列 是 按 顺 序 排列 的 ， 指 的 是 在 Python 中 ， 序 列 是 一 组 按 顺 序 排 列 的 
序列 中 元 素 的 排列 顺序 很 重要 。 字 符 串 是 值 。Python 有 3 种 内 置 的 序列 类 型 : 字符 串 、 
按 顺 序 排列 的 ， 因 为 'abc' 不 同 于 'acb'。 元 组 和 列表 。 

你 将 在 本 章 后 面 看 到 ， 字 典 和 集合 并 不 是 

接 顺 序 排列 的 : 它们 只 关心 自己 是 否 包含 nn a 

特定 元 素 ， 而 不 保证 元 素 的 相对 顺序 。 符 串 一 样 支持 索引 和 切片 。 因 此 ， 所 有 序列 
都 具备 如 下 特征 。 


A .人 ks 、 盐 名 让 六 
序列 可 以 有 多 长 口 第 一 个 正 索 引 为 零 ， 指 向 左 端 。 


从 理论 上 说 ， 序 列 的 长 度 不 受 限 制 ， 口 第 一 个 负 索 引 为 -1， 指 向 右 端 。 


加 需要 包含 任意 数量 能 素 ; 但 实际 中 
国人 口 可 使 用 切片 表示 法 来 复制 子 序列 ， 例 
Ve 如 ，seq[begin:end] 复制 seq 的 如 下 


Se 元 素 : 从 索引 begin 指向 的 元 素 到 索 
引 end - 1 指向 的 元 素 。 


口 可 使 用 + 和 *# 进行 拼接 〈 即 合并 )。 要 
进行 拼接 ,序列 的 类 型 必须 相同 ， 即 
不 能 拼接 元 组 和 列表 。 


口 可 使 用 函数 len 计算 其 长 度 ， 例 如 ， 
len(s) 返回 序列 s 包含 的 元 素数 。 


口 表达 式 x in s 检 查 序列 s 是 和 否 包 含 
元 素 x。 换 句 话 说， 如 果 x 位 于 s 中 ， 
则 x in s 返回 True， 否 则 返回 False。 


实际 上 ， 字 符 串 和 列表 是 最 常用 的 序列 ; 
元 组 有 其 独特 用 途 ， 但 不 那么 常见 
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7.3 ”元 组 未 尾 的 逗号 


元 组 是 一 种 不 可 变 序列 ， 包 含 零 个 或 更 在 单元 素 元 组 中 ,末尾 的 过 号 必 不 可 
多 个 值 。 它 可 以 包含 任何 Python 值 ， 甚 至 可 少 ;而 在 包含 更 多 元 素 的 元 组 ( 和 列表 ) 中 ， 
以 包含 其 他 元 组 。 例 如 : 可 以 在 末尾 添加 过 号 ,但 并 非 必 须 这 样 做 。 
例如 ，(1,2,3,) 与 (1,2,3) 等 价 。 有 些 程 
>>> items = (-6, 'cat', (1, 2)) 序 员 喜欢 总 是 在 末尾 添 加 过 号 ， 以 免 无 意 

>>> items 间 遗 漏 单元 素 元 组 未 尾 的 过 


(=6, “eat's (& 2)) 
>>> len(items) 

3 

>>> items[-1] 

(1, 2) 

>>> items[-1][0] 


1 


正如 你 看 到 的 ， 元 组 用 圆 括号 括 起 ， 其 
中 的 元 素 用 逗号 分 隔 。 空 元 组 用 () 表示 , 但 
只 包含 一 个 元 素 的 元 组 ( 单元 素 元 组 ) 采用 
不 同 寻常 的 表示 法 (x,)， 如 下 所 示 : 


>>> type(()) 

<class 'tuple'> 
>>> type((5,)) 
<class 'tuple'> 
>>> type((5)) 


<class 'int'> 


如 果 省 略 单元 素 元 组 末尾 的 逗号 ， 就 不 
是 创建 元 组 ， 而 是 用 圆 括号 将 表达 式 括 起 。 
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7.3.1 元 组 是 不 可 变 的 

前 面 说 过 ， 元 组 是 不 可 变 的 ， 这 意味 着 
创建 元 组 后 就 不 能 修改 它 。 这 种 特征 并 不 独 
特 ， 字符 串 、 整 数 和 浮 点 数 都 是 不 可 变 的 。 
如 果 要 修改 元 组 ， 就 必须 创建 一 个 体现 更 改 
的 新 元 组 。 例 如 ， 下 面 的 代码 演示 了 如 何 删 
除 元 组 的 第 一 个 元 素 : 


>>> lucky = (6, 7, 21, 77) 
>>> lucky 

(6, 7, 21, 77) 

>>> lucky2 = lucky[1:] 

>>> lucky2 

(7 到 77) 

>>> lucky 


(6, 7, 21, 77) 


从 积极 的 角度 看 ， 不 可 变性 杜绝 了 无 意 
间 修 改元 组 的 可 能 性 ， 有 助 于 防范 错误 ;从 
消极 的 角度 看 ， 即 便 对 元 组 做 细微 的 修改 ， 
都 必须 复制 整个 元 组 ， 这 增加 了 修改 大 型 元 
组 所 需 的 时 间 和 内 存 。 如 果 你 发 现 自己 需要 用 
频繁 地 修改 某 个 元 组 ， 就 应 使 用 列表 蔡 代 它 。 
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7.3.2 ”元 组 函数 表 7-1 元 组 函数 


阁 二 有 函 数 名 返 回 值 

表 7-1 列 出 了 最 常用 的 元 组 汕 数 。 相 比 于 dn op 如 果 x 是 元 组 tup 的 一 个 元 组 ， 则 返 
字符 串 和 列表 ， 元 组 的 函数 较 少 。 下 面 几 个 回 True， 和 否则 返回 False 
示例 演示 了 如 何 使 用 这 些 函 数 : len(tup) 元 组 tup 包含 的 元 素数 

tup.count(x) ”元 素 x 在 元 组 tup 中 出 现 的 次 数 

>>> pets = ('dog', 'cat', 'bird', "dog ) tup.index(x) ”元 组 tup 中 第 一 个 元 素 x 的 索引 ; 如 

>>> pets 果 x 未 包含 在 元 组 tup 中 ， 将 引发 

('dog', 'cat', 'bird', 'dog') ValueError 异常 


>>> 'bird' in pets 

True 

>>> 'cow' in pets 

False 

>>> len(pets) 

4 

>>> pets.count('dog') 

2 

>>> pets.count('fish') 

0 

>>> pets.index('dog') 

0 

>>> pets.index('bird') 

2 

>>> pets.index('mouse') 

Traceback (most recent call last): 
File "<pyshell#41>", line 1, in <module> 
pets.index('mouse') 


ValueError: tuple.index(x): x not in list 
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与 字符 串 一 样 ， 也 可 使 用 + 和 * 来 拼接 
元 组 : 


>>> tup1 = (1, 2, 3) 
>>> tup2 = (4, 5, 6) 
>>> tup1 + tup2 

(五 2 3 4 33 6) 
>>> tup1 * 2 


(1 2 35 11, 2 3) 
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7.4 列表 另外 ， 与 字符 串 和 元 组 一 样 ， 你 可 使 用 


索引 和 切片 来 访问 元 素 和 子 列表 : 
列表 与 元 组 基本 相同 ,但 有 一 个 重要 差 


别 : 列表 是 可 变 的 。 换 名 话说 ， 可 在 不 复制 >>> 1st = [3, (1,), ‘dog', ‘cat'] 
的 情况 下 ， 添 加 、 删 除 或 修改 列表 元 素 。 实 2>> 1st[0] 
际 上 ， 列 表 比 元 组 用 得 多 得 多 ( 有 些 Python 
程序 员 只 是 隐约 知道 有 元 组 这 么 回 事 )。 
1， 
列表 用 方 括号 括 起 ， 其 中 的 元 素 用 逗号 >>> 1st[2] 
分 隔 。 与 字符 串 和 元 组 一 样 ， 你 可 使 用 len ‘dog' 
轻松 地 获悉 列表 的 长 度 ， 还 可 使 用 + 和 * 轻 >>> 1st[1:3] 
松 地 拼接 列表 : [(1,), dog ] 
>>> lst[2:] 
>>> numbers = [7, -7, 2, 3, 2] ['dog', 'cat'] 
>>> numbers >>> 1st[-3:] 
[7, -7, 2,3, 2] [(1,), 'dog', 'cat'] 
>>> len(numbers) >>> 1st[:-3] 
3 [3] 
>>> numbers + numbers 
ee 请 注意 , 列表 可 包含 任何 类 型 的 值 : 数字 、 
>>> numbers * 2 字符 串 甚 至 其 他 序列 。 空 列表 用 [] 表示 ， 而 
[73 =75 2 $23 7 77 2 3 2] 只 包含 一 个 元 素 (x) 的 单元 素 列表 写 做 [x] 


( 与 元 组 不 同 ， 对 单元 素 列 表 来 说 ， 并 非 必 须 


以 逗号 结尾 )。 
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DP 
frog dog OW hamster 
7-1 Python 列表 元 素 指向 其 值 


snake 


a 


图 7-2 一 个 自 引 用 列表 。 请 注意 ， 
向 整个 列表 ， 而 不 是 第 一 个 元 素 


第 二 个 元 素 指 


术语 说 明 

很 多 Python 程序 员 谈 论 列表 时 ， 都 给 
人 以 列表 元 素 包 含 其 值 的 感觉 。 虽 然 这 从 
技术 上 说 不 准确 ， 但 是 一 种 常用 的 便利 措 
词 。 在 处 理 列 表 的 程序 中 查找 错误 时 ， 通 
常 必须 明白 列表 元 素 指向 其 值 ， 而 不 包含 
乱 币 < 


列表 是 可 变 的 
前 面 说 过 ， 列 表 是 可 变 的 ， 这 是 区 分 列 
表 和 元 组 的 重要 特征 。 例 如 : 


>>> pets = ['frog', 'dog', 'cow', 'hamster'] 
>>> pets 

['frog', 'dog', 'cow', 'hamster'] 

>>> pets[2] = 'cat’ 

>>> pets 


['frog', 'dog', 'cat', 'hamster'] 


正如 你 看 到 的 ， 这 里 设置 列表 pets 的 第 
三 个 元 素 , 使 其 指向 'cat' 。 字 符 串 'cow' 被 
替换 掉 ， 并 被 Python 自动 删除 。 


图 7-1 图 示 了 列表 ， 对 理解 列表 很 有 帮 
助 。 与 变量 一 样 ,列表 元 素 指向 ( 而 不 是 包含 ) 
相应 的 值 ， 明 白 这 一 点 很 重要 。 


列表 元 素 指向 相应 的 值 ， 这 可 能 导致 一 
些 不 可 思议 的 行为 。 请 看 下 面 的 示例 : 


>>> snake = [1，2，3] 
>>> snake[1] = snake 
>>> snake 


[1, [...], 3] 


这 里 让 一 个 列表 元 素 指向 列表 本 身 ， 创 
建 了 一 个 自 引用 的 数据 结构 。 打 印 输出 中 的 
[.….] 表明 ，Python 能 够 识别 自 引 用 ,没有 四 
春 地 不 断 打 印 列表 。 图 7-2 图 示 了 列表 snake。 
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7.5 ”列表 函数 


表 7-2 列表 函数 


返 回 值 


列表 有 很 多 实用 函数 ， 如 表 7-2 所 示 。 除 


s.append(x) 


count 只 是 返回 一 个 数字 外 ， 其 他 所 有 函数 都 s.count(x) 
修改 传递 给 它们 的 列表 。 因 此 它们 是 修改 函 s.extend(1st) 
数 ， 使 用 时 必须 小 心 。 例 如 ， 一 不 小 心 就 会 人 


删除 错误 的 元 素 或 在 错误 的 位 置 插入 元 素 。 


an 


函数 append 在 列表 未 尾 添加 一 个 元 素 。 


s.pop(i) 
一 种 常见 的 编程 模式 是 ， 在 函数 开头 创建 一 woo 
个 空 列表 ， 然后 给 列表 添加 元 素 。 例如 ， 下 s.reverse() 
面 的 函数 根据 传人 的 数字 列表 创建 一 个 消息 。 ssort0) 


列表 : 


# numnote.py 
def numnote(l1st): 
msg = [] 
for num in lst: 
if num < 0: 
s = str(num) + ”is negative' 
elif 0 <= num <= 9: 
s = str(num) + ' is a digit' 
msg.append(s) 


return msg 
下 面 是 一 个 调用 该 函数 的 示例 : 


>>> numnote([1, 5, -6, 22]) 
['1 is a digit', '5 is a digit', 


'-6 is negative'] 


.insert(i, x) 


在 列表 s 末尾 添加 元 素 x 

返回 元 素 x 在 列表 s 中 出 现 的 次 数 
将 1st 的 所 有 元 素 都 添加 到 列表 s 
末尾 
返回 第 一 个 x 元 素 的 索引 
将 元 素 x 插 入 到 索引 i 指定 的 元 素 
前 面 ， 结 果 是 s[i] == x 
I 除 并 返回 s 中 索引 为 i 的 元 素 
I 除 s 中 的 第 一 个 x 元 素 

反 转 s 中 元 素 的 排列 顺序 

将 s 的 元 素 按 升序 排列 
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术语 说 明 要 打印 这 些 消 息 ， 并 让 每 条 消息 占据 一 


在 计算 机 编程 中 ， 术 语 弹出 (pop ) 通 和 
常 指 的 是 删除 列表 的 最 后 一 个 元 素 。 与 之 >>> for msg in numnote([1, 5, -6, 22]): 
相关 的 术语 是 压 入 (push )， 指 的 是 在 末尾 » print(msg) 
添加 一 个 元 素 ( 这 正 是 Python 函数 append 1 is a digit 
能 ) 对 同一 个 列表 执行 弹出 和 压 入 时 ， 人 
常 将 这 个 列表 称 为 栈 : 我 们 说 元 素 被 压 -6 is negative 
ve 也 可 以 这 样 做 : 
却 是 众多 高 级 编程 行为 (如 递归 和 撤销 ) 
的 基础 >>> print('\n'.join(numnote([1, 5, -6, 22]))) 
1 is a digit 
5 is a digit 


-6 is negative 


函数 extend 类 似 于 append， 但 在 末尾 添 
加 一 个 序列 : 


>>> lst = [] 

>>> lst.extend('cat') 

>>> lst 

[ey a, "|] 

>>> lst.extend([1, 5, -3]) 


>>> lst 


[e's "a', 3 1, 5, -3] 
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函数 pop 删除 并 返回 给 定 索引 对 应 的 元 
如 下 所 示 : 


>>> lst = ['a', 'b', 'c', 'd'] 
>>> lst.pop(2) 

号 

>>> lst 

['a'’, 'b', 'd'] 

>>> lst.pop() 

‘gi! 

>>> lst 

Wa 


请 注意 ， 如 果 没 有 向 函数 pop 传递 索引 ， 
它 将 删除 并 返回 列表 末尾 的 元 素 。 


函数 remove(x) 删除 列表 中 的 第 一 个 x 元 


素 ， 但 不 返回 该 元 素 : 


加 


3 et: sl a b's “es a] 
>>> lst.remove('a') 

>>> lst 

[bs "es Sad 


顾名思义 ， 艺 数 reverse 反 转 列表 的 元 素 
排列 顺序 : 


S33 dst s [asy. by. "es "a)] 
>>> lst 

[sb es 2 要 

>>> lst.reverse() 

>>> lst 


Ea; We 'p', | 


函数 reverse 不 会 制作 列表 的 拷贝 ， 而 是 
直接 删除 列表 中 的 元 素 ， 因 此 我 们 说 反 转 是 
就 地 完成 的 。 明 白 这 一 点 很 重要 。 
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术语 说 明 

Python 对 序列 进行 排序 的 方式 称 为 字 
典 顺序 (lexicographical ordering )。 这 是 一 
个 通用 术语 ， 指 的 是 “字母 顺序 ”， 但 适用 
于 任何 可 排序 的 值 序列 ， 而 不 仅仅 是 字母 。 
其 基本 理念 是 ， 首 先 按 第 一 项 对 元 素 排序 ， 
如 果 第 一 项 相同 ， 则 按 第 二 项 进行 排序 ， 
如 果 第 三 项 也 相同 ， 则 按 第 三 项 进行 排序 ， 
依 此 类 推 。 


7.6 ”列表 排序 


对 数据 进行 排序 是 计算 机 最 常 做 的 事情 
之 一 。 无 论 是 对 人 还 是 计算 机 来 说 ， 排 序 后 
的 数据 通常 比 未 排序 的 数据 更 容易 处 理 。 例 
如 ， 在 列表 中 查找 最 小 的 元 素 时 ， 如 果 列 表 
经 过 了 排序 ， 就 根本 不 需要 查找 : 第 一 个 元 
素 就 是 。 人 类 通常 喜欢 排列 有 序 的 数据 ， 只 
要 想象 一 下 不 按 字母 顺序 印刷 的 电话 短 就 明 
日 了 ! 


在 Python 中 ， 要 对 列表 进行 排序 ， 最 简 
单 的 方式 是 使 用 函数 sort()。 实 际 上 ， 这 个 
困 数 可 用 于 对 包含 数 万 个 元 素 的 列表 进行 快 
速 排序 。 与 reverse() 一 样 ，sort() 也 就 地 修 
改 列表 : 


SS 1st = [6 0; 4 3 2, 6] 
>>> lst 

[6, 0, 4, 3, 2, 6] 

>>> lst.sort() 

>>> lst 


[0， 2， 3， 4， 6， 6] 
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函数 sort 总 是 按 升序 排列 元 素 一 一 从 最 小 
到 最 大 。 如 果 要 按 相 反 的 顺序 来 排列 元 素 一 一 
从 最 大 到 最 小 ， 则 最 简单 的 方法 是 在 调用 
sort 后 再 调用 reverse: 


>>> lst = ['up', 'down', 'cat', 'dog'] 
>>> lst 

['up', 'down', 'cat', 'dog'] 

>>> lst.sort() 

>>> lst 

['cat', 'dog', 'down', 'up'] 

>>> lst.reverse() 

>>> lst 


['up', 'down', 'dog', 'cat'] 


Python 还 知道 如 何 给 包含 元 组 的 列表 排 
如 下 所 示 : 


了 


>>> pts = [(1, 2), (1, -1), (3, 5), (2, 1)] 
>>> pts 

[(1, 2), (1, -1), (3, 5), (2, 1)] 

>>> pts.sort() 


>>> pts 


[(1， 5 入 (1， 2)5 (2 1)， (3， 5)] 
给 列表 中 的 元 组 排序 时 ， 首 先 按 元 组 的 


第 一 个 元 素 排序 ， 如 果 第 一 个 元 素 相 同 ， 则 
按 第 二 个 元 素 排序 ， 依 此 类 推 。 
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7.7 列表 解析 


列表 用 得 如 此 之 多 ， 以 至 于 Python 提供 
了 一 种 用 于 创建 列表 的 特殊 表示 法 一 一 列表 
解析 。 下 例 演示 了 如 何 使 用 列表 解析 来 创建 
一 个 由 1~10 的 平方 组 成 的 列表 : 


>>> [n * n for n in range(1, 11)] 


[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 

这 种 表示 法 的 主要 优点 是 简洁 易 读 。 下 
面 的 代码 没有 使 用 列表 解析 ,但 与 前 面 的 代 
码 等 价 ， 请 对 它们 进行 比较 : 


Tesult = [] 
for n in range(1, 11): 


result.append(n * n) 


一 旦 你 掌握 了 列表 解析 ， 就 会 发 现 它们 
编写 起 来 快速 而 容易 ， 且 有 众多 用 途 。 
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7.7.1 列表 解析 示例 


了 来 看 儿 个 列表 解析 示例 。 要 将 列表 中 
的 每 个 数字 翻 倍 并 加 上 7， 可 以 这 样 做 : 


>>> [2 * n + 7 for n in range(1, 11)] 

[9, 11, 13, 15, 17, 19, 21, 23, 25, 27] 

要 创建 一 个 列表 ， 它 包含 前 10 个 自然 数 
的 立方 ， 可 这 样 做 : 

>>> [n ** 3 for n in range(1, 11)] 

[1, 8, 27, 64, 125, 216, 343, 512, 729，1000] 


你 还 可 以 在 列表 解析 中 使 用 字符 串 ， 如 
下 所 示 : 


>>> [c for c in 'pizza'] 
Es EA "a'] 
>>> [c.upper() for c in 'pizza'] 


[3 ws 4 网 于 'A'] 


列表 解析 的 一 种 常见 用 途 是 ， 以 某 种 方 
式 修改 现 有 列表 ， 如 下 所 示 : 


>>> names = ['al', 'mei', 'jo', 'del'] 

>>> names 

['al', 'mei', 'jo', 'del'] 

>>> cap names = [n.capitalize() for n in names] 
>>> cap_names 

['Al', 'Mei', 'Jo', 'Del'] 

>>> names 


['al', 'mei', 'jo', 'del'] 
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7.7.2 ”使 用 列表 解析 进行 筛选 

列表 解析 还 可 用 于 吻 除 不 想 要 的 元 素 ， 
例如 ， 下 面 的 列表 解析 返回 一 个 列表 ， 该 列 
表 只 包含 列表 nums 中 的 正 数 : 


>>> nums = [-1, 0, 6, -4, -2, 3] 
>>> result = [n for n in nums if n > 0] 
>>> result 


[6, 3] 


下 面 的 代码 与 上 述 代码 等 价 ， 但 没有 使 
用 列表 解析 : 
result = [] 


nums = [-1, 0, 6, -4, -2,3] 
for n in nums: 
if mn 3 0: 


result.append(n) 


同样 ， 相 比 于 常规 循环 ， 列 表 解 析 更 简 
洁 易 读 。 


生成 器 表达 式 
可 进一步 简化 函数 eat_vowels: 


下 面 的 函数 使 用 列表 解析 删除 字 
的 所 有 元 音 : 


符 串 中 


# eatvowels.py 
def eat vowels(s): 
""" Removes the vowels from s. 


return ''.join([c for c in s if c.lower() 


» not in 'aeiou']) 
其 效果 如 下 : 


>>> eat vowels('Apple Sauce ') 


'ppl 9%c” 


乍 一 看 ，eat_vowels 的 函数 体 星 涩 难 懂 
理解 该 函数 的 诀 容 是 每 次 阅读 一 部 分 。 先 米 
看 列表 解析 : 


[c for c in s if c.lower() not in 'aeiou'] 


这 是 一 个 科 选 型 列表 解析 ， 它 以 每 次 一 
个 字符 的 方式 扫描 s, 将 每 个 字符 转换 为 小 写 ， 
再 检查 它 是 不 是 元 音 。 如 果 是 元 音 ， 则 不 将 
其 加 入 最 终 的 列表 ， 否 则 将 其 加 入 最 终 列表 。 


该 列表 解析 的 结果 是 一 个 字符 串 列 表 ， 
因此 我 们 使 用 join 将 所 有 字符 串 拼 接 成 一 个 
再 返回 这 个 字符 串 。 


删除 列表 解析 中 的 方 括 号 : 


'.join(c for c in s if c.lower() not in 'aeiou') 


这 样 ， 传 递 给 


那样 一 次 性 生成 所 有 元 素 。 


join 的 表达 式 将 是 一 个 生成 器 表达 式 。 
用 生成 器 表达 式 高 效 地 生成 所 需 的 列表 或 序列 部 分 


在 较 复 杂 的 Python 编程 中 ， 可 使 
: 根据 需要 生成 元 素 ， 而 是 不 像 列 表 解 析 
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7.8 字典 术语 说 明 
在 存储 键 - 值 对 方面 ，Python 字典 是 一 字典 也 称 为 关联 数组 、 映 射 或 散 列表 。 
种 效率 极 高 的 数据 结构 。 例 如 : 


>>> color = {'red' : 1, 'blue' : 2, 'green' : 3} 散 列 

>>> color Python 字典 利用 了 一 个 巧妙 的 编程 计 
散 列 。 从 本 质 上 说 ， 字 典 中 的 每 个 
键 痢 被 转换 为 一 个 数字 一 一 艇 列 值 ， 这 是 
使 用 专门 设计 的 散 列 函数 完成 的 。 字 典 的 
值 存储 在 一 个 底层 列表 中 ， 并 将 其 散 列 值 
要 访问 字典 中 的 值 ， 可 使 用 相应 的 键 : 用 作 索 引 。 访 问 值 时 ， 把 提供 的 键 转换 为 
散 列 值 ， 再 跳 到 列表 的 相应 位 置 。 计 算 散 
列 的 细节 很 复杂 ， 所 幸 的 是 ，Python 为 我 
们 处 理 了 这 一 切 。 


{ blue': 2, 'green': 3, 'red': 1} 穷 


字典 color 包含 3 个 成 员 。 一 个 是 'blue' :2， 
其 中 'blue' 为 键 ， 而 2 是 与 之 关联 的 值 。 


>>> color[ 'green'] 
3 
>>> color[ 'red'] 


1 


使 用 键 来 访问 字典 值 的 效率 极 高 ， 即 便 
字典 包含 数 干 个 键 - 值 对 。 


与 列表 一 样 ， 字 上 典 也 是 可 变 的 : 可 以 添 
加 或 删除 键 - 值 对 。 例 如 : 


>>> color = {'red' : 1, 'blue' : 2, 'green' : 3} 
>>> color 

{'blue': 2, 'green': 3, 'red': 1} 

>>> color['red'] = 0 

>>> color 


{ blue': 2, 'green': 3, 'red': 0} 
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7.8.1 对 键 的 限制 

你 需要 知道 的 是 ， 对 字典 键 有 两 个 限制 。 
首先 ， 字 典 中 的 键 必 须 是 独一无二 的 ， 即 在 
同一 个 字典 中 ， 任 何 两 个 键 - 值 对 的 键 都 不 
能 相同 。 例 如 : 


>>> Color = {'red' : 1, 'blue' : 2， "green' 
»: 3, 'red' : 4} 
>>> color 


{'blue': 2,'green': 3, 'red': 4} 
虽然 我 们 使 用 了 'red' 键 两 次 ， 但 Python 


只 存储 了 第 二 个 键 - 值 对 一 一 'red' :4。 根 本 不 
可 能 使 用 相同 的 键 : 字典 键 必须 是 独一无二 的 。 


对 键 的 第 二 个 限制 是 ， 键 必须 是 不 可 变 
的 。 因 此 ,字典 键 不 能 是 列表 , 也 不 能 是 字典 。 
为 何 要 这 样 要 求 呢 ? 因 为 键 - 值 对 在 字典 中 
的 存储 位 置 是 根据 键 计算 得 到 的 。 即 便 键 发 
生 细 微 变 化 ， 键 - 值 对 在 字典 中 的 位 置 也 将 
变化 。 这 可 能 导致 键 - 值 对 丢失 或 无 法 访问 。 


这 两 个 限制 都 不 适用 于 值 。 值 可 以 是 可 变 
的 ， 而 相同 的 值 可 在 同一 个 字典 中 出 现 多 次 。 
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7.8.2 ”字典 函数 


表 7-3 列 


出 了 适用 于 所 有 字典 的 函数 。 


正如 你 看 到 的 ， 要 获取 字典 中 的 值 ， 标 
准 方式 是 使 用 方 括号 表示 法 : d[key] 返回 与 
key 相关 联 的 值 。 调 用 d.get(key) 可 完成 同 
样 的 任务 。 无 论 采取 哪 种 方式 ， 如 果 key 没 
有 包含 在 字典 d 中 ， 都 将 引发 keyError 异常 。 


如 果 你 预先 不 确定 某 个 键 是 否 包含 在 字 
典 中 ， 可 使 用 key in d 进行 检查 。 如 果 key 
包含 在 字典 d 中 ， 这 个 表达 式 将 返回 True， 
否则 返回 False。 这 种 检查 的 效率 极 高 ， 与 用 
于 序列 的 in 相 比 尤其 如 此 。 


还 可 使 用 函数 pop(key) 和 popitem() 来 获 
取 字 典 值 ，pop(key) 和 get(key) 之 间 的 差别 
在 于 ，pop(key) 返回 与 key 相关 联 的 值 ， 并 将 
该 键 - 值 对 从 字典 中 删除 ， 而 get 只 返回 值 。 


表 7-3 字典 函数 


函 数 名 返回 的 值 
d.items() 返回 一 个 由 字典 d 的 键 - 值 对 组 成 的 视图 ( view ) 
d.keys() 返回 一 个 由 字典 d 的 键 组 成 的 视图 
d.values() 返回 一 个 由 字典 d 的 值 组 成 的 视图 
d.get(key) 返回 与 key 相关 联 的 值 
d.pop(key) | 除 键 key 并 返回 与 之 相关 联 的 值 
d.popitem() I 除 字 上 典 d 中 的 某 个 键 - 值 对 并 返回 相应 的 键 - 值 
d.clear() I 除 字典 d 的 所 有 元 素 
d.copy() 复制 字典 d 
d.fromkeys(s, t) 创建 一 个 新 字典 ， 其 中 的 键 来 自 s， 值 来 自 t 
d.setdefault(key, v) 如 果 键 key 包含 在 字典 d 中 ， 则 返回 其 值 ; 否则 ， 返 回 v 并 将 (key, v) 添加 到 字典 d 中 
d.update(e) 将 e 中 的 键 - 值 对 添加 到 字典 d 中 ; e 可 能 是 字典 ， 也 可 能 是 键 - 值 对 序列 
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函数 popitem() 返回 并 删除 字典 的 某 个 键 - 值 
对 ， 具 体 是 哪个 你 预先 并 不 知道 ， 因 此 仅 当 
你 不 在 乎 字典 元 素 的 访问 顺序 时 ， 这 个 函数 
才 适 用 。 


函数 items()、keys() 和 values() 都 返 
回 一 个 特殊 对 象 一 一 视图 。 视 图 被 链接 到 原 
字典 ， 因 此 如 果 字 典 发 生变 化 ， 视 图 也 将 
相应 地 变化 ， 如 下 所 示 : 


>>> color 

{'blue': 2, 'orange': 4, 'green': 3, 'red': 0} 

>>> k = color.keys() 

>>> for i in k: print(i) 

blue 

orange 

green 

red 

>>> color.pop('red') 

0 

>>> color 

{'blue': 2, 'orange': 4, 'green': 3} 7 
>>> for i in k: print(i) 7 
blue 

orange 


green 
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7.9 集合 

在 Python 中， 集合 是 一 系列 不 重复 的 元 
素 。 集 合 类 似 于 字典 ， 但 只 包含 键 ， 而 没有 
相关 联 的 值 。 


集合 分 两 类 : 可 交集 合 和 不 可 变 集合 。 
对 于 可 变 集合 ， 你 可 添加 和 删除 元 素 ， 而 不 
可 变 集合 一 旦 创建 就 不 能 修改 。 


集合 最 常见 的 用 途 可 能 是 用 于 删除 序列 
中 的 重复 元 素 ， 如 下 所 未 : 


SS et: s [4 68 Ly. 5.658 5] 
>>> s = set(lst) 
x 5 


{8, 1， 5， 6} 


与 字典 一 样 ， 集 合 的 元 素 排 列 顺序 也 
不 确定 的 。 


诺 


要 获悉 所 有 集合 都 支持 的 函数 ， 可 在 区 
互 式 命令 行 中 调用 dir(set)， 你 将 发 现 这 样 
的 函数 非常 多 ! 由 于 集合 用 得 没有 列表 和 字 
典 那 么 多 ， 所 以 这 里 不 列举 这 些 函 数 。 但 别 
忘 了 ， 需 要 使 用 集合 时 ， 可 参阅 在 线 文档 ， 
网 址 为 http://docs.python.org/3/library/stdtypes. 
html#set-types-set-frozenset。 


集合 与 字典 

在 Python 中 ,集合 是 相对 较 新 的 功能 。 
在 Python 还 不 支持 集合 时 ,程序 员 使 用 字 
典 来 模拟 集合 ， 实 际 上 Python 的 第 一 个 集 
合 实现 也 是 这 样 做 的 。 如 果 使 用 了 字典 ， 
但 不 关心 其 值 ， 那 么 转 而 使 用 集合 或 许可 
提高 代码 的 可 读 性 。 
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输入 和 输出 


程序 要 有 所 作为 ， 就 需要 与 周遭 世界 通 
信 。 它 需要 与 用 户 交 互 、 读 写 文件 、 访 问 网 
页 等 。 通常， 我 们 称 之 为 输入 和 输出 (简称 
LO )。 


你 见识 过 基本 的 控制 台 IJO， 这 包括 打印 
消息 以 及 使 用 函数 input 读 取 用 户 输入 的 字符 
串 。 本 章 首先 介绍 一 些 设置 字符 串 格式 的 方法 ， 
让 你 能 够 通过 控制 台 IO 输出 美观 的 字符 串 。 


接 下 来 ,我 们 将 把 注意 力 转 向 文件 LO， 
即 读 写 文件 。Python 提供 了 强大 的 基本 文件 


VO 支持 ， 最 大 限度 地 简化 了 程序 员 的 工作 。 
有 具体 地 说 ， 我 们 将 介绍 如 何 使 用 文本 文件 、 
二 进 制 文件 以 及 功能 强大 的 pickle 模块 。 


本 章 内 容 

D 设置 字符 串 的 格式 
口 格式 字符 串 

口 读 写 文件 

口 检查 文件 和 文件 夹 
口 处 理 文本 文件 

口 处 理 二 进 制 文件 


口 读 取 网 页 


8.1 设置 字符 串 格式 

Python 提供 了 很 多 设置 字符 串 格式 的 方 
式 ， 这 里 将 讨论 较 老 的 字符 串 插入 和 较 新 的 
格式 字符 囊 。 


8.1.1 字符 串 插入 

字符 串 插 入 是 一 种 设置 字符 串 格 式 的 简 
单方 法 ， 是 Python 从 编程 语言 C 那里 借鉴 而 
来 的 。 例 如 ， 下 面 的 示例 演示 了 如 何 控 制 小 
数位 数 : 


>>> X = 1/81 

>>> print(x) 

0.0123456790123 

>>> print('value: %.2f' % x) 
value: 0.01 

>>> print('value: %.5f' % x) 


value: 0.01235 


字符 串 插 入 表达 式 总 是 采用 这 样 的 格式 : 
format % values， 其 中 format 是 包含 一 个 或 
多 个 % 字 符 的 字符 串 。 在 示例 "value: %.2f 
% x 中， 子 串 %.2f 是 一 个 格式 设置 命令 ,让 
Python 获取 后 面 提供 的 第 一 个 值 (x )， 并 将 
其 显示 为 包含 两 位 小 数 的 浮 点 数 。 
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表 8-1 一 些 转换 说 明 符 


说 明 符 含 义 

d 整数 
o 八进制 ( 基数 为 8 的 ) 值 
x 小 写 十 六 进 制 ( 基数 为 16 的 ) 数 
X 大 写 十 六 进 制 ( 基数 为 16 的 ) 数 
e 小 写 科学 记 数 法 表示 的 浮 点 数 
E 大 写 科学 记 数 法 表示 的 浮 点 数 
F 浮 点 数 
S 字符 串 
% % 字符 

八进制 和 十 六 进 制 


转换 说 明 符 0 和 Xx 分 别 将 值 转换 为 八 
进 制 和 十 六 进 制 ， 它 们 看 起 来 没什么 价值 ， 
但 在 很 多 计算 机 应 用 程序 中 ， 需 要 将 值 表 
示 为 十 六 进 制 或 不 那么 常见 的 八进制 。 正 
如 你 在 本 章 后 面 将 看 到 的 ， 处 理 二 进 制 文 
件 时 经 常 使 用 十 六 进 制 。 


8.1.2 ”转换 说 明 符 

在 前 面 的 格式 字符 串 中 , ff 是 一 个 转换 
说 明 符 ， 告 诉 Python 如 何 显示 相应 的 值 。 表 
8-1 列 出 了 最 常用 的 转换 说 明 符 。 

说 明 符 e、E 和 于 让 你 能 够 以 不 同 的 方式 
表示 浮 点 数 。 例 如 : 


>>> x 
0.012345679012345678 
>>> print('x = %f' % x) 
x = 0.012346 

>>> print('x = %e' % x) 
x = 1.234568e-02 

>>> print('x = %E' % x) 
x = 1.234568E-02 


你 可 根据 需要 在 格式 字符 串 中 包含 任意 
数量 的 说 明 符 ， 但 必须 为 每 个 说 明 符 提 供 一 
个 值 。 例 如 : 


>>> a, b, c = 'cat', 3.14, 6 

>>> s = 'There\'s %d %ss older than %.2f 
» years' % (c, a, b) 

>>>s 


"There's 6 cats older than 3.14 years" 


从 这 个 示例 可 知 ， 格 式 字符 串 相 当 于 简单 
模板 ， 将 用 指定 的 值 填充 。 值 是 以 元 组 方式 指 
定 的 ， 它 们 的 排列 顺序 必须 与 替换 顺序 一 致 。 


转换 说 明 符 df 和 s 最 常用 ， 因 此 


你 有 必要 记 住 它们 ， 尤 其 是 f， 它 是 控制 浮 点 
数 格式 的 最 简单 方式 。 


国 园 ”如果 妥 在 字符 囊 中 包 合 字 符 %， 必 须 


使 用 '%%'。 
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8.2 ”格式 字符 串 
在 Python 中 ， 另 一 种 创建 美观 字符 串 


的 方式 是 结合 使 用 格式 字符 串 和 字符 串 函 数 
format(value，format_spec)。 例 如 : 


>>> 'My {pet} has {prob}' .format 
» (pet = 'dog', prob='fleas') 
"My dog has fleas 


在 格式 字符 串 中 ， 用 大 括号 括 起 的 内 
容 都 将 被 奉 换 ， 这 称 为 命名 替换 (named 
个 示例 而 言 ， 命名 替换 的 


replacement )。 就 这 


可 读 性 极 佳 。 


你 还 可 以 按 位 置 替 换 值 : 


>>> "My {0} has {1} .format ('dog', 'fleas') 
"My dog has fleas 


还 可 以 像 字 
明 符 : 


符 串 搬入 那样 使 用 转换 说 


>>> '1/81 = {x} .format(x=1/81) 
"1/81 = 0.0123456790123 

>>> "1/81 = {x:f}'.format(x=1/81) 
"1/81 = 0.012346 

>>> '1/81 = {x:.3f}'.format(x=1/81) 
"1/81 = 0.012" 


模板 包 

在 字符 串 持 入 和 格式 字符 串 都 不 够 强 
大 或 灵活 时 ， 可 能 需要 使 用 模板 包 ， 如 
Cheetah ( www.cheetahtemplate.org ) 或 Django 
(www.djangoproject.com ) 提供 的 模板 包 
这 两 个 模板 包 都 让 你 能 够 完成 非常 复杂 网 
替换 ， 在 需要 创建 大 量 动态 生成 的 网 页 时 ， 
这 是 不 错 的 选择 。 
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你 可 以 使 用 大 括号 来 指定 格式 设置 参数 ， 
如 下 所 示 : 


>>> 'num = {x:.{d}f}'.format (x=1/81, d=3) 
“num = 0.012" 
>>> "num = {x:.{d}f}'.format (x=1/81, d=4) 


“num = 0.0123" 


使 用 常规 的 字符 串 插 入 无 法 做 到 这 一 点 。 


}， 可 使 用 {{ 和 上】}}。 


相 比 字符 串 插入 ,格式 字符 串 更 灵活 、 
更 强大 ， 但 也 更 复杂 。 如 果 只 想 创建 一 些 格 
式 简 单 的 字符 串 ， 字 符 串 插入 可 能 是 最 佳 的 
选择 ; 而 格式 字符 串 更 适合 庞大 而 复杂 的 设 
置 任务 ， 如 创建 网 页 或 格式 邮件 。 
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8.3 读 写 文件 


文件 是 一 个 命名 的 比特 集合 ， 存 储 在 硬 
盘 、U 盘 、 闪 存 条 等 辅助 存储 设备 中 。 这 里 
将 文件 分 为 两 类 : 文本 文件 和 二 进 制 文件 ， 
其 中 前 者 本 质 上 是 存储 在 磁盘 中 的 字符 串 ， 
而 后 者 是 其 他 各 种 内 容 。 


文本 文件 具有 如 下 特点 。 


口 基本 上 是 磁盘 中 的 字符 串 。Python 源 代 
码 文件 和 9 HTML 文件 都 属于 文本 文件 。 


口 可 使 用 任何 文本 编辑 融 进 行 编辑 ， 因 
此 对 人 类 来 说 相对 容易 阅读 和 修改 。 


口 对 程序 来 说 ,它们 通常 难以 阅读 ,通常 ， 
每 种 文本 文件 都 需 使 用 相应 的 分 析 程 
序 (parser ) 来 阅读 ， 例 如 ，Python 使 

用 专用 分 析 程 序 来 帮助 阅读 .py 文件 ， 

而 要 阅读 HTML 文件 ， 需 要 使 用 专用 

于 HTML 的 分 析 程 序 。 


口 通常 比 等 价 的 二 进 制 文件 大 。 需 要 通 
过 网 络 发 送 大 型 文本 文件 时 ， 这 是 个 
严重 的 问题 。 因 此 ， 通 党 对 文本 文件 
进行 压缩 《如 压缩 成 zip 格式 )， 以 提 
高 传输 速度 和 节省 磁盘 空间 。 
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二 进 制 文件 具有 如 下 特点 。 


口 通常 是 人 类 无 法 阅读 的 ， 至 少 使 用 常 
规 文本 编辑 需 无 法 查看 。 在 文本 编辑 
和 需 中 打开 二 进 制 文件 时 ， 显 示 的 是 一 
堆 乱 码 。 有 些 类 型 的 二 进 制 文件 〈 如 
JPEG 图 像 ) 需要 使 用 特殊 查看 骨 来 显 
示 其 内 容 。 


D 占据 的 空间 通常 比 等 价 的 文本 文件 小 。 
例如 ， 二 进 制 文件 可 能 将 其 保存 的 信 
息 编 组 ， 每 组 包含 32 位 ， 而 两 组 之 间 
不 使 用 逗号 或 空格 等 分 隔 符 。 


口 对 程序 来 说 ， 它 们 读 写 起 来 通常 比 文 
本 文件 容易 。 虽 然 二 进 制 文件 各 不 相 
同 ， 但 通常 无 需 编写 复杂 的 分 析 程序 
来 读 取 它 们 。 


口 通常 与 特定 程序 相关 联 ， 如 果 没 有 该 
程序 ， 通 常 无 法 使 用 它们 。 有 些 流行 
的 二 进 制 文件 的 格式 是 公开 的 ， 因 此 
如 果 你 愿意 ， 可 以 自己 编写 读 写 它们 
的 程序 ， 但 通常 需要 花 很 大 的 功夫 。 
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8.3.1 文件 夹 

除 文件 外 ， 人 们 还 使 用 文件 夹 (目录 ) 
来 存储 文件 和 其 他 文件 夹 。 大 多 数 文件 系统 
的 文件 夹 结构 都 庞大 而 复杂 ， 呈 层次 型 。 


路 径 名 是 用 于 标识 文件 或 文件 夹 的 名 称 。 
完整 的 路 径 名 可 能 非常 长 ， 例 如 ， 在 我 的 
Windows 计算 机 上 ，Python 安装 文件 夹 的 完 
整 路 径 名 如 下 : C:\Documents and Settings\tjd\ 
Desktop\python 。 


Windows 路 径 名 使 用 反 斜 杠 〈\) 来 分 隔 
路 径 中 的 名 称 ， 并 以 盘 符 〈 这 里 是 C: ) 打头 。 

在 Mac 和 Linux 系统 中 ， 使 用 斜 杠 (1/) 
来 分 隔 名 称 ， 且 不 以 盘 符 打头 。 例 如 ， 在 我 
的 Linux 系统 中 ，Python 安装 文件 夹 的 完整 
路 径 名 如 下 : /home/tjd/Desktop/python。 


本 书 前 面 说 过 ， 如 果 要 在 Python 字 

符 吕 中 包含 \ 字 符 ， 必 须 使 用 \ 
'C:\\home\\tjd\\Desktop\\python’ 

为 避免 使 用 两 个 反 斜 杆 ， 可 使 用 原始 字符 串 : 


r'C:\home\tjd\Desktop\python' 


ES 在 Python 程序 中 支持 这 两 种 风格 的 
路 径 名 有 点 棘手 ， 有关 这 方面 的 更 详细 信息 ， 
请 参阅 有 关 Python 模块 os.path 的 文档 。 


8.3.2 ”当前 工作 目录 


很 多 程序 都 使 用 了 当前 工作 目录 (cwd ) 
的 概念 ， 这 指 的 是 默认 目录 。 操 作文 件 或 文 
件 夹 时 ， 如 果 你 没有 提供 完整 路 径 名 ，Python 
将 假定 你 指 的 是 当前 工作 目录 中 的 相应 文件 
或 文件 夹 。 
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8.4 检查 文件 和 文件 夹 


Python 提供 了 很 多 这 样 的 函数 : 返回 有 
关 计算 机 文件 系统 中 文件 和 文件 夹 的 信息 。 
表 8-2 列 出 了 其 中 最 实用 的 几 个 。 


下 面 来 编写 几 个 函数 ， 看 看 上 述 函 数 
的 工作 原理 。 例 如 ， 一 种 常见 的 任务 是 获 
悉 当 前 工作 目录 中 的 文件 和 文件 夹 。 代 码 
os.listdir(os.getcwd()) 比较 难看 ， 因 此 我 
们 编写 下 面 这 样 的 函数 : 


# list.py 
def list cwd(): 


return os.listdir(os.getcwd()) 


下 面 是 两 个 相关 的 辅助 函数 ， 它 们 使 用 
列表 解析 分 别 返 回 当前 工作 目录 中 的 文件 和 
文件 类 : 


# list.py 
def files cwd(): 
return [p for p in list cwd() 
if os.path.isfile(p)] 
def folders cwd(): 
return [p for p in list cwd() 


if os.path.isdir(p)] 


表 8-2 ”实用 的 文件 和 文件 夹 函数 


函 数 名 作 用 
os.getcwd() 返回 当前 工作 目录 的 名 称 
os.listdir(p) 返回 一 个 字符 串 列表 ， 其 中 包含 路 径 p 指定 的 文件 夹 中 所 有 文件 和 文件 夹 的 名 称 
os.chdir(p) 将 当前 工作 目录 设置 为 路 径 p 
os.path.isfile(p) 当 路 径 p 指定 的 是 一 个 文件 的 名 称 时 ， 返 回 True， 否 则 返回 False 
os.path.isdir(p) 当 路 径 p 指定 的 是 一 个 文件 夹 的 名 称 时 ， 返 回 True， 和 否则 返回 False 
os.stat(fname) 返回 有 关 fname 的 信息 ， 如 大 小 (单位 为 字 节 ) 和 最 后 一 次 修改 时 间 
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如 果 只 想 获悉 当前 工作 目录 中 的 .py 文 
件 ， 可 编写 如 下 函数 : 


# list.py 
def list py(path = None): 
if path == None: 
path = os.getcwd() 
return [fname for fname in os.listdir(path) 
if os.path.isfile(fname) 
if fname.endswith(' .py')] 


这 个 函数 巧妙 地 利用 了 其 输入 参数 : 如 
果 你 调用 list_py() 时 未 提供 参数 ， 它 将 把 当 
前 工作 目录 视 为 目标 文件 来 ,否则 将 指定 的 
目录 视 为 目标 文件 夹 。 


最 后 ， 下 面 的 函数 返回 当前 工作 目录 中 
所 有 文件 的 大 小 总 和 : 


# list.py 
def size in bytes(fname): 
return os.stat(fname).st size 
def cwd size in bytes(): 
total = 0 
for name jin files cwd(): 
total = total + size in bytes(name) 


return total 


一 个 巧妙 的 诀窍 

可 重 写 函 数 cwd size in bytes， 使 其 
只 包含 一 行 代码 ; 

def cwd size in bytes2(): 

return sum(size in bytes(f) 
for f in files cwd()) 

详细 解释 cwd size in bytes2 的 工作 
原理 超出 了 本 书 的 范围 ， 如 果 你 对 这 种 更 
简洁 的 方式 感 兴 趣 ， 可 在 网 上 搜索 Python 
生成 器 表达 式 。 
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fa 为 节省 篇 幅 ， 我 们 省 略 了 这 些 函 数 的 
文档 字符 串 。 然 而 ， 在 Google pythonintro 网 
站 (http:/pythonintro.googlecode.com ) 提供 的 
示例 代码 文件 中 ， 都 包含 文档 字符 囊 。 


从 名 称 cwd_size in bytes 可知， 其 
返回 值 以 字 节 为 单位 。 通 过 在 函数 名 中 包含 
返回 值 的 单位 ， 无 需 查看 文档 就 能 获悉 单位 。 


一 般 而 言 ， 大 量 使 用 函数 是 个 不 错 的 
主意 。 即 便 函 数 像 List _ dir() 那样 只 有 一 行 
代码 ， 也 很 有 帮助 ， 因 为 它们 让 程序 更 容易 
理解 和 维护 。 


函数 os.stat() 非常 复杂 ， 它 提供 的 
有 关 文件 的 信息 比 这 里 演示 的 多 得 多 。 有 关 这 
个 函数 的 更 详细 信息 ， 请 参阅 Python 在 线 文 
档 (http:/docs.python.org/3/library/os.html )。 
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8.5 ”处 理 文本 文件 


在 Python 中 ， 处 理 文本 文件 相对 容易 。 
通常 采用 图 8-1 所 示 的 3 个 步骤 来 处 理 文件 。 


8.5.1 逐 行 读 取 文 本 文件 

读 取 文本 文件 的 最 常见 方式 可 能 是 每 次 
读 取 一 行 。 例 如 ， 下 面 的 代码 在 屏幕 上 打印 
文件 的 内 容 : 


# printfile.py 
def print file1(fname) : 
f = open(fname, 'r') 
for line in f: 
print(line, end = '') 


f.close() \# 这 行 代码 是 可 选 的 


这 个 函数 的 第 1 行 打开 指定 的 文件 : 调 
用 冰 数 open 时 ， 必 须 指 定 你 要 处 理 的 文件 的 
名 称 ,还 必须 指定 打开 模式 。 这 里 只 读 取 文件 ， 
因为 以 读 取 模式 ('r' ) 打开 它 。 表 8-3 列 出 
了 Python 中 主要 的 文件 打开 模式 。 函 数 open 
返回 一 个 特殊 的 文件 对 象 ， 表 示人 磁盘 中 的 文 
件 。 最 重要 的 是 ，open 不 将 文件 读 取 到 内 存 
中 。 在 上 述 示 例 中 ,使 用 for 循环 以 每 次 一 
行 的 方式 读 取 文 件 。 函 数 print_file1 的 最 后 
一 行 关 闭 文件 ; 正如 注释 指出 的 , 这 是 可 选 的 ， 
因为 Python 几乎 总 是 会 自动 为 你 关闭 文件 。 
在 这 里 , f 是 函数 print_filel 中 的 一 个 局 部 
变量 ， 因 为 函数 print filel 结束 时 ，Python 
将 自动 关闭 并 删除 f 指 向 的 文件 对 象 (不 是 
文件 本 身 )。 


打开 文件 


处 理 文件 


关闭 文件 


8-1 文本 文件 的 3 个 主要 处 理 步 又 。 要 使 用 文 
件 ， 必 须 先 打开 它 ; 使 用 完毕 后 再 将 其 关闭 ， 确 保 
将 所 有 修改 都 提交 给 文件 


表 8-3 Python 文件 打开 模式 


字 符 含义 


文本 模式 ( 默认 模式 ) 
为 读 写 打 开 文 件 


"为 读 取 而 打 开 文件 (默认 模式 ) 
Ww。 为 写 人 而 打开 文件 

"a ”为 在 文件 末尾 附件 而 打开 文件 
二进制 模式 

三 
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默认 为 读 取 模式 
如 果 你 只 想 读 取 文本 文件 ， 可 在 调用 
函数 open 时 只 传递 文件 名 。 例 如 : 


f = open(fname) 


未 指定 模式 参数 时 ，Python 假定 你 要 
为 读 取 而 打 开 文 本 文件 。 


SEE 在 函数 print filel 中 ，print 语句 将 


end 设置 为 "'， 因 为 文件 中 的 各 行 都 以 字符 \n 
结尾 。 如 果 将 该 print 语句 改 为 print(line)， 
显示 的 文件 内 容 中 将 包含 额外 的 空 行 ( 试 试 就 
明白 了 )。 


后 园 ”如 采 打 开 文 件 时 出 错 ， 程 序 可 能 在 未 
妥善 关闭 文件 的 情况 下 终止 。 下 一 章 将 介绍 
如 何 处 理 这 样 的 错误 ， 确 保 总 是 妥善 地 关闭 
文件 。 


8.5.2 将 整个 文本 文件 作为 一 个 字符 
串 进行 读 取 

另 一 种 读 取 文本 文件 的 常见 方式 是 ， 将 

其 作为 一 个 大 型 字符 串 进行 读 取 ， 如 下 所 示 : 


# printfile.py 

def print file2(fname): 
f = open(fname, 'r') 
print(f.read()) 
f.close() 


这 比 函 数 print_filel 短小 、 简 单 ， 很 多 
程序 员 都 喜欢 采用 这 种 方式 。 然 而 ， 如 果 要 
读 取 的 文件 非常 大 ， 将 占用 大 量 内 存 ， 这 可 
能 降低 计算 机 的 运行 速度 ， 甚 至 导致 计算 机 


CL 
朋 策 。 


最 后 ， 我 们 注意 到 很 多 程序 员 将 上 述 函 
数 编写 为 下 面 一 行 代码 ; 


print(open(fname, 'r').read()) 


这 种 形式 更 紧 竣 ， 可 能 需要 一 段 时 间 才 
能 习惯 ， 但 很 多 程序 员 都 喜欢 这 种 风格 ， 因 
为 其 输入 量 少 ， 可 读 性 也 相对 较 高 。 
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8.5.3” 写 入 文本 文件 

写 入 文本 文件 只 比 读 取 文本 文件 复杂 
一 点 点 ， 例 如 ， 下 面 这 个 函数 新 建 一 个 名 为 
story.txt 的 文本 文件 : 


# write.py 

def make story1(): 
f = open('story.txt', 'w') 
f.write('Mary had a little lamb,\n') 


f.write('and then she had some more.\n') 


'w" 让 Python 以 写 入 模式 打开 文件 。 为 
将 文本 写 和 文件， 你 调用 f.write， 并 将 要 写 
入 的 字符 串 传递 给 它 。 字 符 串 将 以 指定 的 顺 
序 写 入 文件 。 


需要 注意 的 是 ， 如 果 文 件 story.txt 已 经 存 
在 ,调用 open('story.txt'，'w') 将 删除 它 ! 
如 果 你 不 想 履 盖 story.txt， 应 先 检 查 它 是 否 存 
在 : 


# write.py 
import os 
def make story2(): 
if os.path.isfile('story.txt'): 
print('story.txt already exists') 
else: 
f = open('story.txt', 'w') 
f.write('Mary had a little lamb,\n') 


f.write('and then she had some more.\n') 


8.5.4 ”附加 到 文本 文件 未 尾 

将 字符 串 加 入 到 文本 文件 时 ， 一 种 常见 
的 方式 是 将 它们 附加 到 文件 末 。 与 模式 'w' 不 
同 ,这 种 模式 不 会 删除 文件 既 有 的 内 容 。 例 如 : 


def add to story(line, fname = 'story.txt'): 
f = open(fname, 'a') 


f.write(line) 


这 里 需要 注意 的 一 个 要 点 是 ， 
附加 模式 ("a' ) 打开 的 。 


文件 是 以 
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8.5.5 将 字符 串 插入 到 文件 开头 

相 比 于 在 文件 末尾 附加 字符 串 ， 将 字符 
串 写 入 文件 开头 不 那么 容易 ， 因 为 操作 系统 
Windows、Linux 和 Macintosh 都 没有 为 这 样 
做 提供 直接 支持 。 要 将 文本 插入 到 文件 开头 ， 
最 简单 的 方式 可 能 如 下 : 将 文件 读 取 到 一 
字符 串 中 ， 将 新 文本 插入 到 该 字符 串 ， 再 } 
这 个 字符 串 写 入 原来 的 文件 ， 如 下 所 示 : 


> 


ESy 


def insert title(title, fname = 'story.txt'): 
f = open(fname, 'r+') 
temp = f.read() 
temp = title + '\n\n' + temp 
f.seek(0) \# 让 文件 指针 指向 文件 开头 
f.write(temp) 


首先 ， 注 意 到 我 们 使 用 了 特殊 模式 "r+ 
来 打开 文件 ， 这 意味 着 可 读 取 和 写 入 文件 。 
接 下 来 ,我 们 将 整个 文件 读 取 到 字符 串 变 量 
temp 中 ， 并 使 用 字符 串 拼 接 搬 入 标题 (title )。 


将 新 创建 的 字符 串 写 回 文件 前 ， 必 须 先 
让 文件 对 象 f 重 置 其 内 部 的 文件 指针 。 所 有 
文本 文件 对 象 都 记录 了 它 当前 指向 文件 的 什 
么 位 置 ， 调 用 f.read() 后 ， 文 件 指针 指向 文 
件 末尾 。 通 过 调用 f.seek(0)， 计 文件 指针 重 
新 指向 了 文件 开头 ， 这 样 写 入 时， 将 从 文 
件 开头 开始 。 
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8.6 处理 二 进 制 文件 

如 果 文 件 不 是 文本 文件 ， 它 就 被 视 为 二 
进 制 文件 。 二 进 制 文件 以 模式 'b' 打开 ， 而 
你 可 访问 其 各 个 字 节 。 例 如 ; 


def is gif(fname): 
f = open(fname, 'br') 
first4 = tuple(f.read(4)) 
return first4 == (Ox47, Ox49, Ox46, Ox38) 


这 个 函数 检查 fname 是 不 是 GIF 图 像 文 
件 ， 方 法 是 检查 其 前 4 个 字 节 是 不 是 (0x47， 
0x49，0x46，0x38)( 所 有 GIF 图 像 文件 都 以 
这 4 个 字 节 打头 )。 


在 Python 中 ， 类 似 于 0x47 的 数字 为 十 六 
进 制 数 。 十 六 进 制 数 非常 适合 用 于 处 理 字 节 ， 
因为 每 个 十 六 进 制 位 对 应 于 4 比特 ， 因 此 使 
用 两 个 十 六 进 制 位 (0x47 ) 可 描述 一 个 字 节 。 


注意 到 文件 是 以 'br' 模式 打开 的 ， 这 表 
示 二 进 制 读 取 模式 。 读 取 二 进 制 文件 时 ， 调 
用 .read(n) 来 读 取 接 下 来 的 n 个 字 节 。 与 文 
本 文件 对 象 一 样 ， 二 进 制 文件 对 象 也 使 用 文 
件 指针 来 记录 接 下 来 应 读 取 文件 的 哪个 字 节 。 
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术语 说 明 piokle 

Python 模块 pickle 执行 的 操作 通常 被 访问 二 进 制 文件 的 各 个 字 节 是 一 种 非常 
称 为 对 象 串 行 化 ( 简称 串 行 化 ) 其 基本 思 ” ”低级 的 操作 ,虽然 在 系统 编程 中 很 有 用 ,但 
想 是 ， 将 复杂 的 数据 结构 转换 为 字 节 流 ， 在 较 高 级 的 应 用 程序 编程 中 用 途 有 限 。 
即 创建 数据 结构 的 串 行 化 表示 。 


在 处 理 二 进 制 文件 方面 ，pickle 通常 是 一 
种 方便 得 多 的 方式 。Python 模块 pickle 让 你 能 
够 轻松 地 读 写 几乎 任何 数据 结构 ， 如 下 所 示 : 


# picklefile.py 
import pickle 
def make pickled file(): 
grades = {'alan' : [4, 8, 10, 10], 
tom [7 7 23 8]s 
'dan' : [5, None, 7, 7], 
"may”: [10, 8, 10, 10]} 
outfile = open('grades.dat', 'wb') 
pickle.dump(grades, outfile) 


def get pickled data(): 
infile = open('grades.dat', 'rb') 
grades = pickle.load(infile) 


return grades 


基本 上 ， 你 可 使 用 pickle.dump 将 数据 结 
构 存 储 到 磁盘 ， 以 后 再 使 用 pickle.1oad 从 磁 
盘 获 取 数 据 结构 。 对 很 多 程序 来 说 ， 这 都 是 
一 项 特别 有 用 的 功能 ， 因 此 每 当 需 要 存储 二 
进 制 数据 时 ， 都 应 考虑 使 用 这 种 功能 。 
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除数 据 结 构 外 ， 还 可 使 用 pickle 来 存 
储 函 数 。 


pickle 不 能 用 于 oe 
制 文件 ， 如 GIF 文件 。 对 于 这 样 的 文件 ， 
须 逐 字 节 处 理 。 


Python 包含 一 个 名 为 shelve 的 模块 ， 
这 个 模块 提供 了 存储 和 检索 数据 的 更 高 级 方 
式 。 模 块 shelve 让 你 能 够 将 文件 视 为 字典 ， 
更 详细 的 信息 请 参阅 Python 文档 ( http://docs. 
python.org/3/library/shelve.html )。 


Python 还 有 一 个 名 为 sqlite3 的 模块 ， 
这 个 模块 提供 了 访问 SQLite 数据 库 的 接口 ， 
让 你 能 够 编写 SQL 命令 来 存储 和 检索 数据 ， 
就 像 使 用 Postgres 和 MySQL 等 大 型 数据 库 产 
品 时 一 样 。 有 关 这 方面 的 更 详细 信息 ， 请 参 
阅 Python 文档 (http://docs.python.org/3/library/ 
sqlite3.html )。 
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8.7 读 取 网 页 


Python 为 访问 网 络 提供 了 强大 支持 。 一 
种 常见 的 任务 是 让 程序 自动 读 取 网 页 ， 而 使 
用 模块 urllib 可 轻松 地 完成 这 种 任务 : 


>>> import urllib.request 


>>> page = urllib.request. urlopen 
» ("http://www.python.org') 


>>> html = page.read() 
>>> html[:25] 
b'<!DOCTYPE html PUBLIC "-/" 


html 包含 www.python.org 处 网 页 的 全 部 
文本 。 这 些 文本 是 HTML 格式 的 ， 因 此 与 你 
在 Web 浏览 器 中 使 用 “查看 源 代 码 ” 选 项 看 
到 的 结果 一 样 。 将 网 页 作为 字符 串 存 储 到 计 
算 机 中 后 ， 便 可 使 用 Python 字符 串 操 作 也 数 
提取 其 中 的 信息 。 


模块 urllib 还 让 你 能 够 以 编程 方式 发 
a 更 详细 信息 请 参阅 Python 文档 ( http:// 
docs.python.org/3/howto/urllib2.html )。 


要 将 网 页 读 取 到 字符 串 变 量 中 ， 第 一 
步 是 创建 一 个 Web 请 求 。 接 下 来 的 一 个 重要 
步骤 是 分 析 字 符 串 识别 并 提取 标题 、 段 
落 、 表 格 等 。Python 通过 模块 html.parser 提 
供 了 一 个 基本 的 HIML 分 析 库 ， 更 详细 的 
信息 请 参阅 Python 文档 (http://docs.python. 
org/3/library/html.parser.html )。 


8 另 一 个 绝妙 的 模块 是 webbrowser， 它 
让 你 能 够 以 编程 方式 在 浏览 器 中 显示 网 页 。 
例如 ， 下 述 代 码 在 默认 Web 浏览 器 中 显示 雅 
虎 的 主页 : 


>>> import webbrowser 
>>> webbrowser.open ( "http://www.yahoo.com ') 
True 


>>> 
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寞 吊 处 


程序 如 何 处 理 意 料 之 外 的 错误 呢 ? 异常 
为 这 个 难题 提供 了 解决 方案 。 例 如 ， 如 果 在 
读 取 文件 期 间 ， 计 算 机 上 的 其 他 程序 将 其 删 
除了 ， 结 果 将 如 何 呢 ? 如 果 程 序 从 网 站 下 载 
网 页 时 ， 该 网 站 突然 骨 泪 ,结果 又 将 如 何 呢 ? 


在 这 些 以 及 众多 其 他 情形 下 ，Python 采 
取 的 措施 是 引发 异常 。 异 常 是 一 种 特殊 的 错 
误 对 象 ， 你 可 以 捕获 并 检查 它们 ， 以 决定 如 
何 处 理 错误 。 

异常 可 能 改变 程序 的 控制 流程 。 根 据 发 
生 的 时 机 ， 蜡 常 可 能 导致 执行 流程 跳出 孔 数 
或 进入 处 理 错 误 的 代码 块 。 


通常 ， 你 无 法 准确 确定 哪 一 行 可 能 引 
发 异常 ， 这 带 来 了 一 些 环 手 的 问题 。 因 此 ， 
Python 提供 了 一 个 特殊 的 异常 处 理 结构 ， 可 
用 于 捕获 异常 ， 并 确保 无 论 是 否 出 现 异 常 都 
将 执行 清理 代码 。 


各 


口 清理 操作 


9.1 异常 术语 说 明 


一 个 异常 的 例子 是 IOError， 当 你 试图 打 在 Python 中 发 生 弄 常 时 ， 我 们 称 之 

开 不 存在 的 文件 时 将 引发 这 种 异常 2 
果 不 采取 任何 措施 ， 程 序 通 常会 立即 停 

>>> open('unicorn.dat') 止 运行 ， 并 显示 栈 跟 踪 。 然 而 ， 正 如 你 
Traceback (most recent call last) : 稍 后 将 看 到 的 ， 在 要 供 他 人 使 用 的 程序 


File "<pyshell#1>", line 1, in <module> ee 
| : ， 中 ， 通 常 捕获 并 处 理 异 常 。 
open( "unicorn.dat ') 
File "C:\Python30\lib\io.py", line 284， 
”in new _ 
return open(*args, **kwargs) 
File "C:\Python30\lib\io.py", line 223， 
in open 
closefd) 
IOError: [Errno 2] No such file or directory: 
"unicorn.dat 


出 现 异 常 后 ， 如 果 不 捕 获 或 以 任何 其 他 
方式 进行 处 理 ，Python 将 立即 停止 运行 程序 ， 
并 显示 栈 跟踪 一 一 异常 发 生前 调用 的 函数 清 
单 。 这 对 确定 导致 错误 的 代码 行 很 有 帮助 。 


在 上 述 栈 跟踪 中 ， 最 后 一 行 表明 引发 了 
IOError 异常 ， 具 体 地 说 ， 这 意味 着 在 当前 工 
作 目 录 中 找 不 到 文件 unicorn.dat。IOError 显 
示 的 错误 消息 随 导 致 异常 的 原因 而 异 。 
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引发 异常 

正如 你 从 函数 open 身上 看 到 的 ，Python 
内 置 函 数 和 库 函 数 通常 在 出 现 意外 情况 时 引 
发 异常 。 


例如 ， 除 以 零 将 掀 出 异常 : 


>>> 1/0 

Traceback (most recent call last): 
File "<pyshell#0>", line 1, in <module> 
1/0 


ZeroDivisionError: int division or modulo 
”by zero 


在 Python 中 ， 语 法 错误 也 会 导致 异常 : 


>>>X := 5 

SyntaxError: invalid syntax (<pyshell#2>, 
”line 1) 

>>> print('hello world) 


SyntaxError: EOL while scanning string 
* literal (<pyshell#3>, line 1) 


另外 ,在 代码 的 任何 地 方 都 可 使 用 raise 
语句 故意 引发 异常 ， 如 下 所 示 : 


>>> raise IOError('This is a test!') 
Traceback (most recent call last): 
File "<pyshell#6>", line 1, in <module> 
raise IOError('This is a test!') 


IOError: This is a test! 


Python 包含 大 量 内 置 的 异常 ， 这 些 异 
常 被 组 织 成 层次 结构 ， 更 详细 的 信息 请 参阅 
Python 文 档 (http://docs.python.org/3/library/ 


exceptions.html#bltin-exceptions )。 
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9.2 ”捕获 异常 
异常 发 生 时 ， 你 有 如 下 两 种 选择 。 


1. 忽略 异常 ， 让 程序 崩 演 并 显示 栈 跟踪 。 
在 开发 程序 期 间 ， 你 通常 想 这 样 做 ， 
为 栈 跟 踪 提 供 的 调试 信息 很 有 帮助 。 


2. 捕获 异常 ， 并 打印 友好 的 错误 消息 力 

至 试图 修复 问题 。 对 于 要 供 非 程序 员 
使 用 的 程序 ， 几 乎 都 应 这 样 做 。 普 通 
用 户 可 不 想 看 到 栈 跟 踪 ! 


下 面 的 示例 演示 了 如 何 捕获 异常 。 这 里 
假设 你 要 从 用 户 那里 获取 一 个 整数 ， 为 此 你 
反复 提示 用 户 ， 直 到 用 户 输 入 有 效 的 整数 : 


def get_age() : 
while True: 
try: 
n = int(input('How old are you? ')) 
return n 
except ValueError: 


print('Please enter an integer value.') 
这 个 函数 中 的 while 循环 是 一 个 try/ 


except 块 。 你 可 将 可 能 引发 异常 的 代码 放 在 
try 块 中 。 


函数 会 引发 哪些 异常 

你 怎么 知道 在 函数 get age() 中 应 检 
查 异 常 ValueError 呢 ? 这 是 通过 函数 的 文 
档 获 悉 的 。 文 档 完 备 的 函数 会 指出 它 可 能 
引发 哪些 异常 ,例如 ,函数 open 的 文档 (http:/ 
docs.python.org/3/library/functions.html?#open ) 
指出 ， 它 可 能 引发 异常 IOError。 然 而 ， 并 
非 所 有 的 Python 内 置 函 数 都 如 此 友善 ， 例 
如 ， 函 数 int 的 文档 就 对 其 可 能 引发 的 异 
常 一 字 未 提 。 在 这 种 情况 下 ， 要 摘 清 楚 可 
能 出 现 的 异常 ， 必 须 阅 读 其 他 Python 示例 
代码 或 使 用 命令 行进 行 试验 。 
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只 要 try 块 中 的 代码 出 现 异常 ,就 将 跳 过 
其 他 所 有 未 执行 的 语句 ， 立 即 跳 转 到 except 
块 。 在 这 个 示例 中 ， 如 果 出 现 异常 ， 将 跳 过 


return 语句 。 


如 果 try 块 没 有 引发 异常 ， 将 忽略 ( 跳 
过 ) exceptValueError 块 。 


在 这 个 示例 中 ， 如 果 用 户 输入 的 字符 
串 不 是 有 效 的 整数 ， 函 数 int() 将 引发 异常 
ValueError， 进 而 跳 转 到 except ValueError 
块 并 打印 错误 消息 。 出 现 ValueError 异常 时 ， 
将 跳 过 return 语 句 一 一 立即 跳 转 到 except 块 。 


如 果 用 户 输入 的 是 有 效 整 数 ， 就 不 会 引 
发 异常 , 因此 Python 将 接着 执行 return 语句 ， 
从 而 结束 函数 。 
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9.2.1 try/except 块 


try/except 块 的 工作 原理 有 点 像 if 语句 ， 
但 存在 一 个 重大 不 同 : if 语句 根据 布尔 表达 
式 的 结果 决定 如 何 做 ， 而 try/except 块根 据 
是 否 出 现 了 异常 决定 如 何 做 。 


同一 个 函数 可 能 引发 多 种 异常 ， 还 可 能 
出 于 不 同 原因 引发 相同 的 异常 。 下 面 是 函数 
int() 可 能 引发 的 3 种 异常 ( 为 方便 阅读 ， 删 
除了 栈 跟踪 ): 


>>> int('two') 
ValueError: invalid literal for int() with 
base 10: 'two' 


>>> int(2，10) 
TypeError: int() can't convert non-string 
» With explicit base 


>>> int('2', 1) 


ValueError: int() arg 2 must be >= 2 and <= 36 

这 表明 int() 至 少 会 出 于 两 个 不 同 的 原 
因 引 发 异常 ValueError， 还 至 少 会 出 于 男 一 
个 原因 引发 异常 TypeError。 
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9.2.2 ”捕获 多 种 异常 


你 可 编写 处 理 多 种 异常 的 try/except 块 。 
为 此 ， 可 在 except 子 句 中 指定 多 种 异常 : 


def convert to_int1(s，base) : 
try: 
return int(s, base) 
except (ValueError, TypeError): 


return ‘error' 


如 果 要 分 别处 理 不 同 的 异常 ， 可 使 用 多 
个 except 子 句 : 


def convert to int2(s, base): 
try: 
return int(s, base) 
except ValueError: 
return "Value error' 
except TypeError: 


return 'type error’' 


9.2.3 捕获 所 有 异常 


如 果 你 在 except 子 句 中 没有 指定 异常 ， 
它 将 捕获 所 有 异常 : 


def convert to int3(s, base): 
try: 
return int(s, base) 
except: 


return ‘error' 


这 种 except 子 句 将 捕获 所 有 异常 ， 它 不 
关心 发 生 的 是 哪 种 错误 ， 而 只 关心 是 否 发 生 
了 错误 。 在 很 多 情况 下 ， 这 就 足够 了 。 


+ 


泊 
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9.3 ”清理 操作 


在 try/except 块 中 ， 可 包含 执行 清理 操 
作 的 finally 代码 块 ， 如 下 所 示 : 


def invert(x): 
try: 
return 1 /x 
except ZeroDivisionError: 
return ‘error' 
finally: 


print('invert(%s) done' % x) 


finally 块 肯定 会 执行 ， 它 要 么 在 执行 
try 块 后 执行 ， 要么 在 执行 except 块 后 执行 。 
在 不 管 是 否 发 生 异 常 都 要 执行 某 些 代码 时 ， 
这 很 有 用 。 人 例如， 通常 将 关闭 文件 的 语句 放 
在 finally 块 中 ,这样 文 件 肯定 会 被 关闭 ， 即 
便 发 生 了 I0Error 异常 。 


二 
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另 一 种 格式 设置 方式 

在 上 述 两 个 代码 片段 中 ， 为 让 文件 每 
行 开头 的 行 号 右 对 齐 ， 并 在 行 号 左边 填充 
零 ，print 语句 都 使 用 了 字符 串 插 入 。 如 有 果 
你 想 使 用 格式 字符 串 ， 可 将 这 些 print 语 
多 替换 为 下 述 语句 : 


print('{0:04} {1}'.format(num, line), 
engdEe ne, 


with 语句 

为 确保 即便 发 生 异 第 ， 也 将 尽早 执行 清 
理 操作 ( 如 关闭 文件 )， 还 可 使 用 Python 语句 
with。 例 如 ， 请 看 下 面 的 代码 ， 它 在 屏幕 上 
打印 文件 内 容 ， 并 给 每 一 行 都 加 上 行 号 : 


num = 1 

f = open(fname) 

for line in f: 
print('%04d %s' % (num, line), end = "') 
num = num + 1 


\# 后 续 代码 


这 里 不 知道 文件 对 象 f 将 在 何 时 关闭 。f 
通常 在 for 循环 结束 后 关闭 ， 但 不 知道 准确 
的 时 间 。 换 名 话说 ， 不 再 需要 后 ，f 保持 打开 
状态 多 长 时 间 是 不 确定 的 ， 如 果 其 他 程序 试 
图 访问 这 个 文件 ， 这 可 能 是 个 问题 。 


为 确保 不 再 需要 的 文件 被 尽早 关闭 ， 可 
使 用 with 语句 : 


num = 1 
with open(fname, 'r') as f: 
for line in f: 
print('%04d %s' % (num, line), end = "') 


num = num + 1 


这 个 代码 片段 的 屏幕 输出 与 前 一 个 代码 
片段 相同 ， 但 使 用 with 语句 时 ， 将 在 for 循 
环 结束 后 立即 执行 文件 对 象 清 理 操作 ( 即 关 
闭 文件 ), 避免 了 不 再 需要 的 下 处 于 打开 状态 。 
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面 问 对 象 编程 


本 章 简 要 地 介绍 面向 对 象 编程 (简称 
OOP )。OOP 是 一 种 组 织 程序 的 方法 ， 提 倡 仔 
细 设 计 和 代码 重用 。 大 多 数 现代 编程 语言 都 
支持 OOP， 事 实证 明 这 是 一 种 组 织 和 创建 大 
型 程序 的 实用 方式 。 


从 本 质 上 说 ， 对 象 是 一 组 数据 以 及 操作 
这 些 数据 的 函数 。 本 书 一 直 在 使 用 Python 对 
象 ， 因 为 数字 、 字 符 串 、 列 表 、 字 典 和 函数 
都 是 对 象 。 


要 创建 新 型 对 象 ， 必 须 先 创建 类 。 从 本 
质 上 说 ， 类 就 是 设计 蓝图 ， 用 于 创建 特定 类 
型 的 对 象 。 类 指定 了 对 象 将 包含 哪些 数据 和 
函数 ， 还 指定 了 对 象 与 其 他 类 的 关系 。 对 象 
封装 了 数据 以 及 操作 这 些 数 据 的 函数 。 


一 个 重要 的 OOP 功能 是 继承 : 创建 新 类 
时 ， 可 让 它 继承 既 有 类 的 数据 和 抑 数 。 受 善 
地 使 用 继承 可 避免 重新 编写 代码 ， 还 可 让 程 
序 更 容易 理解 。 


本 章 内 容 

口 编写 类 

口 显示 对 象 

口 灵活 的 初始 化 

口 设置 函数 和 获取 函数 
口 继承 


口 多 态 


口 更 深入 地 学 习 


10.1 编写 类 


下 面 就 来 介绍 OOP 一 一 编写 一 个 表示 人 
的 简单 类 
# person.py 


class Person: 


""" Class to represent a person 


def init (self): 
self.name = "" 


self.age = 0 


上 述 代码 定义 了 一 个 名 为 Person 的 类 。 
它 定义 了 Person 对 象 包 含 的 数据 和 孔 数 。 
Person 类 很 简单 ， 它 包含 数据 name 和 age; 当 
前 唯一 一 个 函数 是 __init _， 这 是 用 于 初始 化 
对 象 值 的 标准 泡 数 。 正 如 你 将 看 到 的 ， 你 创建 
Person 对 象 时 ，Python 将 自动 调用 init 。 


在 类 中 定义 的 函数 被 称 为 方法 。 与 __ in 让 _ 
一 样 ， 方 法 的 第 一 个 参数 必须 是 self ( 稍 后 
将 更 详细 地 讨论 self )。 

可 以 像 下 面 这 样 使 用 Person 对 象 : 


>>> p = Person() 


>>> p 


<__main_ _.Person object at 
—> OxO0AC3370> 


>>> p.age 
0 


>>> p.name 


>>> p.age = 55 
>>> p.age 

55 

>>> p.name = 'Moe' 
>>> p.name 


"Moe 


术语 说 明 

在 有 些 OOP 语 言 中 ，_init_ 被 称 
为 构造 函数 ， 因 为 它 构造 对 象 。 每 次 创建 
新 对 象 时 ， 都 将 调用 构造 函数 。 在 Java 和 
C++ 等 语言 中 ， 创 建 对 象 时 需要 使 用 关键 


字 new。 
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图 10-1 在 这 个 例子 中 ， 变 量 p 指向 一 个 Person 
对 象 ( 由 圆圈 表示 )。 从 Person 类 的 定义 可 知 ， 
Person 对 象 包含 变量 age 和 name， 你 可 以 像 使 用 
常规 变量 那样 使 用 它们 ， 但 必须 使 用 句点 表示 法 ， 
即 p.age 和 p.name。Python 自动 给 每 个 对 象 添加 
特殊 变量 self， 这 个 变量 指向 对 象 本 身 ， 让 类 中 
的 函数 能 够 明确 地 引用 对 象 的 数据 和 函数 


要 创建 Person 对象， 只 需 调 用 Person()。 
这 导致 Python 运行 Person 类 的 函数 _init ， 
并 返回 一 个 新 的 Person 对 象 。 


变量 age 和 mname 包 含 在 对 象 中 ， 因 此 
每 个 新 创建 的 Person 对 象 都 有 自己 的 age 和 
name。 要 访问 age 和 name， 必 须 使 用 句点 表 
示 法 指定 存储 它们 的 对 象 。 


参数 self 

你 可 能 注意 到 了 ， 我 们 调用 Person() 时 
没有 提供 任何 参数 , 但 函数 init (self) 期 
望 获得 名 为 self 的 输入 。 这 是 因为 在 OOP 中 ， 
self 是 一 个 指 问 对 象 本 身 的 变量 ， 如 图 10-1 
所 示 。 这 个 概念 很 简单 , 却 难 倒 了 很 多 初学 者 。 


所 有 类 都 应 该 有 方法 __init (self)， 
这 个 方法 的 职责 是 初始 化 对 象 ， 如 初始 化 对 
象 的 变量 。 方法 init _ 仅 被 调用 一 次 
在 对 象 被 创建 时 。 正 如 你 将 看 到 的 ， 可 根据 
需要 给 ”init _ 指定 其 他 参数 。 


我 们 遵循 Python 的 标准 做 法 ， 将 
__init _ 的 第 一 个 参数 命名 为 self。 并 非 必 须 
使 用 这 样 的 名 称 ， 你 根据 自己 的 喜好 使 用 任何 
变量 名 (而 不 是 self) 然而 ， 使 用 self 是 大 
家 普遍 接受 的 Python 约定 ， 如 果 你 使 用 其 他 名 
称 ， 只 会 让 阅读 你 代码 的 其 他 程序 员 迷 惑 。Java 
和 C++ 等 其 他 一 些 语 言 要 求 必须 使 用 名 称 this。 


IE 在 Python 中 ， 可 像 使 用 其 他 数据 类 
型 一 样 使 用 对 象 : 可 将 它们 传递 给 函数 、 存 
储 到 列表 和 字典 中 、 保 存 到 文件 中 ， 等 等 。 
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10.2 ”显示 对 象 


前 面 说 过 ， 方 法 是 在 类 中 定义 的 函数 。 
下 面 给 Person 类 添加 一 个 方法 ， 用 于 打印 
Person 对 象 的 内 容 : 


# person.py 
class Person: 
""" Class to represent a person 


TY 


def init (self): 
self.name = "" 
self.age = 0 

def display(self): 


print("Person('%s', age)" % (self.name, 
self.age)) 


方法 display 将 Person 对 象 的 内 容 以 适 
合 程序 员 阅 读 的 格式 打印 到 屏幕 上 : 


>>> p = Person() 
>>> p.display() 
Person('', 0) 

>>> p.name = 'Bob' 
>>> p.age = 25 
>>> p.display() 
Person('Bob' , 25) 
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方法 display 的 效果 很 好 ， 但 我 们 还 可 以 
做 得 更 好 : Python 提供 了 一 些 特殊 方法， 让 
你 能 够 定制 对 象 以 支持 天 衣 无 颖 的 打印 。 例 
如 ， 特 殊 方法 __str__ 用 于 生成 对 象 的 字符 
串 表 示 : 


# person.py 
class Person: 
# 为 节省 篇 幅 ， 省 略 了 __init_ _ 
def display(self): 
print("Person('%s', age)" % 
» (self.name, self.age)) 
def _ str (self): 


return "Person('%s', age)" % 
» (self.name, self.age) 


现在 我 们 可 以 这 样 编写 代码 : 


>>> p = Person() 
>>> str(p) 


"Person('', 0)" 


还 可 使 用 str 来 简化 方法 display: 


# person.py 
class Person: 
# 为 节省 篇 幅 ， 省 略 了 __init__ 
def display(self): 
print(str(self)) 
def str (self): 


return "Person('%s', age)" % 
» (self.name, self.age) 
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你 还 可 定义 特殊 方法 __repr _ ， 它 返 
回 对 象 的 “官方 ”(official ) 表示 。 例 如 ， 
Person 对 象 的 默认 官方 表示 不 太 实 用 : 


>>> p = Person() 
>>> pp 


<__main _.Person object at 0x012C3170> 


通过 添加 方法 __repr ,我们 可 控制 
这 里 打印 的 字符 串 。 在 大 多 数 类 中 ,方法 
__repr _ 都 与 方法 __str _ 相同 : 


# person.py 
class Person: 
# 为 节省 篇 幅 ， 省 略 了 __init_ _ 
def display(self): 
print(str(self)) 
def str (self): 
return "Person('%s', age)" % 
— (self.name, self.age) 
def _ repr_ (self): 


return str(self) 


现在 Person 对 象 使 用 起 来 更 容易 : 


>>> p = Person() 
>>> pp 

Person('', 0) 
>>> str(p) 


"Person('', 0)" 
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创建 自己 的 类 和 对 象 时 ， 编 写 函 数 
__sStr 和 _ Tepr _ 几乎 总 是 值得 的 。 它 们 
对 于 显示 对 象 的 内 容 很 有 帮助 ， 而 显示 对 象 
的 内 容 有 助 于 调试 程序 。 


如 果 你 定义 了 方法 Tepr_ ， 但 没有 
定义 方法 __str _ ， 则 对 对 象 调用 str() 时 ， 
将 执行 ”repr 。 


添加 方法 __repr _ 后， 可 进一步 简 
化 方法 display: 

def display(self) : 

print(self) 


实际 上 ， 通 常 没有 必要 编写 方法 display。 


Python 文档 建议 将 对 象 的 字符 串 表 示 
设置 为 创建 对 象 所 需 的 代码 。 这 种 约定 很 有 
用 ， 让 你 能 够 轻松 地 创建 对 象 一 一 只 需 将 字 
符 串 表示 复制 并 粘贴 到 命令 行 。 
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10.3 灵活 的 初始 化 


当前 ， 要 创建 具有 特定 姓名 和 年 龄 的 
Person 对 象 ， 必 须 这 样 做 : 


>>> p = Person() 
>>> p.name = “Moe' 
>>> p.age = 55 
>>> p 


Person('Moe', 55) 


一 种 更 方便 的 方法 是 ， 在 构造 对 象 时 将 
姓名 和 年 龄 传递 给 _init _。 为 此 ， 需 要 重 


写 __in Tt 


# person.py 
class Person: 
def init (self, name = "'， 
age = 0): 


self.name = name 


self.age = age 
这 样 ， 初 始 化 Person 对 象 将 简单 得 多 : 
>>> p = Person('Moe', 55) 


>>> p 


Person('Moe', 55) 
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由 于 __init__ 的 参数 有 默认 值 ， 你 甚至 
可 以 创建 “ 空 的 ”Person 对 象 


>>> p = Person() 
>>> pp 


Person('', 0) 


注意 方法 __init _， 我 们 在 其 中 使 用 了 
self.name 和 name ( 以 及 self.age 和 age)。 
变量 name 指向 传人 init _ 的 值 ， 而 self. 
name 指向 存储 在 对 象 中 的 值 。 使 用 self 更 清 
楚 地 指出 了 谁 是 谁 。 


虽然 给 _ init _ 的 参数 指定 默认 值 很 
容易 ， 进 而 让 你 能 够 轻松 地 创建 空 的 Person 
对 象 ， 但 从 设计 角度 看 ， 这 是 不 是 个 好 主意 
就 不 那么 显而易见 了 。 空 的 Person 对 象 没有 
真正 意义 上 的 姓名 和 年 龄 ， 因 此 需要 在 处 理 
Person 对 象 的 代码 中 检查 这 一 点 。 始 终 需 要 
检查 特殊 情形 很 快 会 成 为 负担 ， 而 且 容易 忘 
记 。 因 此 ， 很 多 程序 员 选 择 不 像 这 里 那样 给 
_ init _ 的 参数 指定 默认 值 。 
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10.4 ”设置 函数 和 获取 函数 


当前 ， 我 们 可 以 使 用 句点 表示 法 来 读 写 
Person 对 象 的 name 和 age 值 : 


>>> p = Person('Moe', 55) 
>>> p.age 

55 

>>> p.name 

"Moe 

>>> p.name = 'Joe' 

>>> p.name 

'Joe" 

>>> p 


Person('Joe', 55) 


这 种 做 法 存在 的 一 个 问题 是 ， 可 能 不 小 
心 将 年 龄 设置 为 荡 雇 的 值 ， 如 -45 或 509。 对 
于 常规 Python 变量 ， 无 法 对 可 赋 给 它 的 值 进 
行 限制 。 但 在 对 象 中 ， 可 编写 特殊 的 设置 函 
数 (setter ) 和 获取 函数 (getter )， 对 存 取 
值 的 方式 进行 控制 。 


首先 ， 添 加 一 个 设置 函数 ， 它 仅 在 提供 
的 值 合理 时 才 修 改 age: 


def set age(self, age): 
if 0 < age <= 150: 


self.age = age 
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装饰 器 

装饰 器 是 Python 中 的 一 种 通用 结构 ， 
用 于 系统 地 修改 婚 有 函数 。 装 饰 器 通常 放 
在 函数 开头 ， 并 以 @ 字 符 打 头 。 在 本 书 中 ， 
我 们 将 使 用 装饰 器 来 创建 设置 函数 和 获取 
函数 。 


现在 可 以 像 下 面 这 样 编写 代码 : 


>>> p = Person('Jen', 25) 
>>> pp 

Person('Jen', 25) 

>>> p.set age(30) 

>>> pp 

Person('Jen', 30) 

>>> p.set age(-6) 

>>>p 


Person('Jen', 30) 


对 于 这 种 设置 函数 ， 一 种 常见 的 抱怨 是 ， 
输入 p.set age(30) 比 输入 p.age = 30 更 烦琐 。 
为 解决 这 种 问题 ,可 使 用 特性 装饰 器 (property 


decorator )。 


10.4.1 ”特性 装饰 器 

特性 装饰 器 融 变 量 的 简洁 与 函数 的 灵活 
于 一 身 。 装 饰 器 指出 函数 或 方法 有 点 特殊 ， 
这 里 使 用 它们 来 指示 设置 函数 和 获取 函数 。 


获取 函数 返回 变量 的 值 ， 我 们 将 使 用 @ 
property 装饰 需 来 指出 这 一 点 : 


@property 
def age(self): 


""" Returns this person's age. 


return self. age 


这 个 age 方法 除 必 不 可 少 的 self 外 
不 接受 任何 参数 。 我 们 在 它 前 面 加 上 了 
property， 指 出 这 是 一 个 获取 函数 。 这 个 方法 
的 名 称 将 被 用 于 设置 变量 。 
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我 们 还 将 底层 变量 self.age 重 命名 为 
self._age。 在 对 象 变量 前 加 上 下 划 线 是 一 种 
常见 的 做 法 ， 这 里 使 用 这 种 方式 将 这 个 变量 
与 方法 age 区 分 开 来 。 你 需要 将 Person 类 中 
的 每 个 self.age 替换 为 self. age。 为 保持 一 
致 性 ， 最 好 也 将 self.name 都 蔡 换 为 self._ 
name。 修 改 后 的 Person 类 类 似 于 下 面 这 样 : 


# person.py 
class Person: 
def init (self, name = "'， 
age = 0): 


self. name = name 


self. age = age 


@property 
def age(self): 


return self. age 


def set age(self, age): 
if 0 < age <= 150: 


self. age = age 


def display(self): 
print(self) 


def str (self): 


return "Person('%s', %s)" % 


» (self. name, self. age) 


def repr (self): 


return str(self) 
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为 给 age 创建 设置 函数 ， 我 们 将 方法 
set age 重 命名 为 age， 并 使 用 @age.setter 


进行 装饰 : 


@age.setteT 
def age(self, age): 
if 0 < age <= 150: 


self. age = age 


完成 这 些 修改 后 ， 就 可 以 像 下 面 这 样 编 
写 代码 了 : 


>>> p = Person('Lia', 33) 
>>> p 

Person('Lia'，33) 

>>> p.age = 55 

>>> p.age 

55 

>>> p.age = -4 

>>> p.age 

55 


由 于 给 age 提供 了 设置 函数 和 获取 函数 ， 
编写 的 代码 就 像 直接 使 用 变量 age， 但 差别 在 
于 : 遇 到 代码 p.age = -4 时 ，Python 实际 上 
将 调用 方法 age(self，age); 同样 ， 遇 到 代 
码 p.age 时 ,将 调用 方法 age(self)。 这 提供 
了 如 下 优点 : 赋值 语法 很 简单 ， 同 时 可 控制 
变量 的 设置 和 获取 方式 。 
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10.4.2 ”私有 变量 术语 说 明 
依然 可 以 直接 访问 self._age: 不 以 下 划 线 打头 的 变量 是 公有 变量 ， 
任何 代码 都 可 访问 它们 。 


>>> p. age = -44 
>>>p 


Person('Lia', -44) 
可 题 在 于 ， 直 接 修 改 _age 可 能 导致 对 


象 不 一 致 ， 因 此 通常 不 布 望 直接 修改 的 情况 
发 生 。 


为 降低 变量 self. age 被 直接 修改 的 可 
能 性 ， 一 种 方式 是 将 其 重 命名 为 self.__age， 
即 在 变量 名 开头 包含 两 个 下 划 线 。 两 个 下 划 
线 表 明 age 是 私有 变量 ， 不 应 在 Person 类 外 
直接 访问 它 。 要 直接 访问 self. age， 需 要 
在 前 面 加 上 _Person， 如 下 所 示 : 


>>> p._Person age = -44 
>>>p 


Person('Lia', -44) 


这 虽然 不 能 禁止 你 直接 修改 内 部 变量 ， 
但 将 无 意 间 这 样 做 的 可 能 性 几乎 降 到 了 零 。 
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6 一 国 编写 大 型 程序 时 ， 一 条 实用 的 经 验 规 
则 是 ， 首 先 将 所 有 对 象 变 量 都 设置 为 私有 的 
( 即 以 两 个 下 划 线 打头 )， 再 在 有 充分 理由 的 
情况 下 将 其 改 为 公有 的 。 这 可 避免 无 意 间 修 
改 对 象 内 部 变量 导致 的 错误 。 


乍 一 看 ， 创 建设 置 函 数 和 获取 函数 的 
语法 有 点 怪 ， 但 习惯 后 你 就 会 发 现 这 种 语法 
非常 清晰 。 别 忘 了 ， 并 非 总 是 需要 创建 设置 
函数 和 获取 函数 ; 对 于 简单 对 象 (如 最 初 的 
Person )， 使 用 常规 变量 可 能 很 不 错 。 


SEE 有 些 程序 员 喜 欢 尽 可 能 不 提供 设置 函 
数 ， 让 对 象 是 不 可 变 的 ， 就 像 数 字 、 字 符 串 
和 元 组 一 样 。 如 果 对 象 没 有 设置 函数 ， 则 创 
建 它 后 ， 就 无 法 通过 “正规 渠道 ”对 其 做 任 
何 修改 。 与 其 他 不 可 变 对 象 一 样 ， 这 可 避免 
众多 微妙 的 错误 ， 并 让 不 同 的 变量 共享 同一 
个 对 象 ( 从 而 节省 内 存 )。 当 然 这 也 存在 缺点 ， 
那 就 是 如 果 你 需要 修改 对 加 ,唯一 的 选择 是 
创建 一 个 体现 了 变更 的 新 对 象 。 


如 果 程 序 员 试图 将 age 设置 为 指定 范 
围 外 的 值 ，age(self,age) 什么 都 不 会 做 。 另 
一 种 方法 是 故意 引发 异常 ， 要 求 设置 age 的 
代码 必须 处 理 这 种 异常 。 引 发 异常 的 优点 在 
于 ， 这 可 能 有 助 于 发 现 其 他 错误 。 试 图 将 age 
设置 为 荒 廖 的 值 可 能 表明 程序 的 其 他 地 方 有 
问题 。 
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10.5 ”继承 


继承 是 一 种 重用 类 的 机 制 ， 让 你 能 够 这 


样 创建 全 新 的 类 : 给 既 有 类 
和 方法 。 


的 拷贝 添加 变量 


假设 我 们 要 开发 一 款 游 戏 ， 其 中 涉及 


人 类 玩家 和 计算 机 玩家 。 为 


此 ， 可 创建 一 个 


Player 类 ， 它 包含 所 有 玩家 都 有 的 东西 ， 如 


得 分 和 名 称 : 


# players.py 

class Player: 
def init (self, name) 
self. name = name 
self. score = 0 

def reset score(self): 
self. score = 0 


def incr score(self): 


self. score = self. score + 1 


def get name(self): 
return self. name 


def str (self): 


return "name = '%s', score = %s" 
» % (self. name, self. score) 
def repr (self): 
return 'Player(%s)' % str(self) 
我 们 可 以 像 下 面 这 样 使 用 Player 对 象 : 
>>> p = Player('Moe') 
>>> p 
Player(name = 'Moe', score = 0) 
>>> p.incr score() 
>>> p 
Player(name = 'Moe', score = 1) 
>>> p.reset score() 
>>> p 
Player(name = 'Moe', score = 0) 
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re 响 们 假设 有 两 类 玩家 : 人 和 计算 机 。 主 
要 差别 在 于 ， 人 通过 键盘 输入 走 法 ， 而 计算 
机 使 用 函数 生成 走 法 。 除 此 之 外 ， 这 两 类 玩 
家 相同 ， 它 们 都 有 名 称 和 得 分 。 


用 于 描述 继承 的 术语 很 多 。 如 果 Human 
类 继承 了 Player 类 ,我们 可 以 这 样 说 : 


Be 下 面 来 编写 一 个 hunan 类 ,用 于 表示 人 类 
人 玩家 。 为 此 ， 一 种 办 法 是 通过 复制 并 粘贴 新 
口 Human 是 Player 的 子 类 ， 而 Player 建 Player 类 的 一 个 拷贝 ， 再 添加 让 玩家 走 棋 

是 Human 的 超 类 。 的 方法 make_move(self)。 这 种 办 法 虽然 可 行 ， 
口 Human 是 一 个 Player。 但 更 佳 的 做 法 是 使 用 继承 。 我 们 可 以 让 Human 


类 继承 Player 类 的 所 有 变量 和 方法 ， 这 样 就 
不 需要 再 次 编写 它们 了 : 


最 后 一 个 术语 (是 一 个 ) 意味 着 所 有 
人 都 是 玩家 。 要 创建 类 层次 结构 ， 一 种 方 
式 是 考虑 类 之 间 可 能 存在 的 是 一 个 关系 。 class Human(Player): 


pass 


在 Python 中 ，pass 语句 表示 “什么 都 不 
做 ”"。 对 Human 类 来 说 ， 这 是 一 个 完整 而 实用 
的 定义 ， 它 继承 Playet 的 代码 ， 让 我 们 能 够 
像 下 面 这 样 做 : 


>>> h = Human('Jerry') 

>>> h 

Player(name = 'Jerry', score = 0) 
>>> h.incr score() 

>>> h 

Player(name = 'Jerry', score = 1) 
>>> h.reset score() 

>>> h 


Player(name = 'Jerry', score = 0) 


考虑 到 我 们 只 为 Human 类 编写 两 行 代码 ， 


这 相当 令 人 难忘 ! 10 
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重 写 方法 

一 个 小 瑕 病 是 , h 的 字符 串 表示 为 
Player， 但 更 准确 的 说 法 应 该 是 Human。 为 修 
复 这 种 问题 ， 可 给 Human 定义 方法 __repr__: 


class Human(Player): 
def _ TepT_ (self): 
return 'Human(%s)' % str(self) 


这 样 结果 将 如 下 : 


>>> h = Human('Jerry') 
>>> h 


Human(name = 'Jerry', score = 0) 

这 就 是 方法 重 写 : Human 中 的 方法 
__repr _ 重 写 了 从 Player 那里 继承 的 方法 
__repr__。 这 是 定制 派生 类 的 常用 方式 。 


现在 ， 可 轻松 编写 类 似 的 Computer 类 ， 
用 于 表示 计算 机 玩家 : 


class Computer(Player): 
def _ TepT_ (self): 
return 'Computer(%s)' % str(self) 


这 3 个 类 组 成 了 一 个 小 型 的 类 层次 结构 ， 
如 图 10-2 的 类 图 所 示 。Player 为 基 类 ， 而 其 
他 两 个 类 为 派生 (扩展 ) 类 。 


Player 


Pa 


Computer Human 


10-2 类 图 指出 了 Player、Human 和 Computer 
类 之 间 的 关系 。 其 中 的 箭头 表示 继承 ， 而 整个 类 图 
是 一 个 由 类 组 成 的 层次 结构 。 较 抽象 (通用 ) 的 类 
位 于 顶部 附近 ， 而 较 具 体 ( 特殊 ) 的 类 位 于 底部 附 
近 从 本 质 上 说 ,扩展 类 继承 了 基 类 的 变量 和 方法 ; 
要 让 派生 类 共享 的 所 有 代码 都 应 放 在 基 类 中 


术语 说 明 
基 类 常 被 称 为 父 类 ， 而 派生 类 常 被 称 
为 子 类 。 
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10.6 多 态 


为 演示 OOP 的 威力 ， 咱 们 来 创建 一 个 名 
为 Undercut 的 简单 游戏 。 在 这 个 游戏 中 ， 两 
个 玩家 同时 选择 一 个 1~10 的 整数 ， 如 果 一 个 
玩家 选择 的 整数 比 对 方 选择 整数 的 小 1， 则 该 
玩家 获胜 ， 否 则 算 打 平 。 例 如 ， 如 果 Thomas 
和 Bonnie 一 起 玩 游戏 Undercut， 且 他 们 选择 
的 数字 分 别 为 9 和 10， 则 Thomas 获胜 ; 如 
果 他 们 分 别 选 择 4 和 7， 则 打 成 平手 。 


下 面 是 一 个 玩 Undercut 游戏 的 函数 : 


def play undercut(p1, p2): 

pi.reset score() 
p2.reset score() 
m1 = pi.get move() 
m2 = p2.get move() 
print("%s move: %s" % (pi.get name(), m1)) 
print("%s move: %s" % (p2.get name(), m2)) 
if ml == m2 - 1: 

p1.incr score() 

return p1, p2, '%s wins!' % pi1.get name() 
elif m2 == m1 - 1: 

p2.incr score() 

return p1, p2, '%s wins!' % p2.get name() 
else: 


return p1, p2, 'draw: no winner' 


如 果 你 仔细 阅读 这 个 函数 的 代码 ， 将 发 
现 调 用 了 pi.get move() 和 p2.get move()。 
我 们 还 没有 实现 这 些 函 数 ， 因 为 它们 随 游戏 
而 异 。 下 面 就 来 实现 这 些 函 数 。 
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10.6.1 实现 get_move 函数 

虽然 在 游戏 Undercut 中 ， 走 法 不 过 是 选 
择 1~10 的 数字 ,但 人 和 计算 机 选择 数字 的 
方式 截然 不 同 。 人 类 玩家 通过 键盘 输入 一 个 
1~10 的 数字 ， 而 计算 机 玩家 使 用 函数 来 选择 
数字 。 因 此 ，Human 和 Computer 类 需要 专用 
的 get_move(self) 方法 。 


下 面 是 Human 类 的 方法 get_move ( 为 市 
省 篇 幅 ， 精 简 了 错误 消息 ， 在 网 站 的 配套 源 
代码 中 ， 包含 更 完整 、 更 友好 的 消息 ): 


class Human(Player): 
def repr (self): 
return 'Human(%s)' % str(self) 


def get move(self): 
while True: 
try: 
n = int(input('%s move (1 - 10): " 
» % self.get name())) 
if 1 <= Nn <= 10: 
return n 
else: 
print('Oops!') 
except: 


print('Oops!') 


上 述 代码 不 断 要 求 用 户 输入 一 个 1~10 的 
整数 ， 直 到 用 户 按 要 求 做 。try/except 结构 
用 于 捕获 用 户 输入 的 不 是 整数 ( 如 two ) 时 函 
数 int 引发 的 异常 。 
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对 于 计算 机 玩家 ， 我们 让 它 返 回 一 个 
1~10 的 随机 数 ( 如 果 需 要 ， 以 后 可 改进 计算 
机 采取 的 策略 ): 


import random 


class Computer(Player): 
def repr (self): 
return 'Computer(%s)' % str(self) 


def get move(self): 
return random.randint(1, 10) 
10.6.2” 玩 游戏 Undercut 


万 事 俱 备 ， 可 以 开始 玩 游戏 Undercut 了 。 
先 让 人 和 计算 机 来 玩 这 款 游 戏 : 


>>> c = Computer( "Hal Bot') 
>>> h = Human("Lia ') 

>>> play_undercut(c, h) 

Lia move (1 - 10): 7 

Hal Bot move: 10 

Lia move: 7 


(Computer(name = 'Hal Bot', score = 0)， 
» Human(name = 'Lia', score = 0)， 
» 'draw: no winner') 


必须 在 函数 play_undercut 外 面 创建 玩家 
对 象 ， 明 白 这 一 点 很 重要 。 这 是 一 种 良好 的 
设计 : 兄 数 play_undercut 只 关心 玩 游戏 ， 而 
不 关心 如 何 初始 化 玩家 对 象 。 


函数 play_undercut 返回 一 个 形式 为 (p1， 
p2，message) 的 三 元 组 。 其 中 p1 和 p2 是 传人 
的 玩家 对 象 ， 如 果 有 玩家 获胜 ， 则 将 其 得 分 
加 1。nmessage 是 一 个 字符 串 ， 指 出 了 获胜 的 
玩家 或 打 成 平 手 。 
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虽 play_ 


>>> c1 = Computer('Hal Bot') undercut 也 能 正常 运行 ， 但 这 个 接口 不 太 
>>> c2 = Computer('MCP Bot ') 合理 : 第 二 二 E 够 看 到 第 一 个 玩家 选 
>>> play_undercut(c1，c2) 择 的 数字 ! 为 让 两 个 人 玩 这 个 游戏 时 比较 
Hal Bot nove: 8 有 趣 ， 你 需要 想 办 法 避免 第 二 个 玩家 看 到 
MCP Bot move: 7 第 一 个 玩家 选择 的 数字 。 
(Computer(name = 'Hal Bot', score = 0)， 
Computer(name = 'MCP Bot', score = 1)， 这 3 个 示例 (人 对 人 人 人、 计算 机 对 计算 
0 机 和 人 对 计算 机 ) 展示 了 多 态 的 威力 : 使 
这 次 没有 人 类 玩家 ， 因 此 不 会 要 求 用 户 用 相同 的 函数 实现 了 截然 不 同 的 行为 。 我 
输入 数字 。 们 没有 编写 3 个 不 同 的 函数 ， 而 是 只 编写 


下 一 个 函数 ， 并 给 它 传递 不 同 的 对 象 。 
还 可 以 传人 两 个 人 类 玩家 : 
实际 上 ， 这 通常 是 一 大 优点 。 为 使 用 
>>> h1 = Human('Bea') ， 需 一 定 的 经 验 ， 还 需 特 别 注意 
am ne 设计 细节 ， 这 需要 更 多 时 间 和 精力 ， 但 这 
>> 1，h2 
>>> play_undercu 通常 物 超 所 值 ， 
Bea move (1 - 10): 5 
Dee move (1 - 10): 4 
Bea move: 5 
Dee move: 4 


(Human(name = 'Bea', score = 0)， 
Human(name = 'Dee', score = 1)， 
'Dee wins!') 
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10.7 更 深入 地 学 习 


本 章 介绍 了 OOP 的 一 些 基 本 知识 ,Python 
还 有 很 多 其 他 OOP 功能 ， 你 可 通过 阅读 在 线 
文档 进行 学 习 。 


一 个 重要 主题 是 打造 良好 的 面向 对 象 设 
计 。 相 比 于 仅仅 使 用 对 象 ， 妥 善 地 使 用 对 象 
要 难得 多 。 为 组 织 面向 对 象 的 程序 ， 一 种 流 
行 的 方式 是 使 用 面向 对 象 设计 模式 。 面 向 对 
象 设计 模式 是 使 用 对 象 解决 常见 编程 问题 的 
处 方 ， 经 过 了 实践 的 检验 。 


在 探讨 这 个 主题 的 著作 中 ，Erich Gamma、 
Richard Helm 、Ralph Johnson 和 John Vlissides 
所 著 的 《设计 模式 : 可 复 用 面向 对 象 软件 的 
基础 》 影 响 最 为 深远 。 掌 握 OOP 的 所 有 技术 
细节 后 ， 如 果 要 了 解 重要 的 设计 问题 ， 阅 读 
这 部 著作 将 是 很 不 错 的 选择 。 
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某 例 研究 : 文本 统计 


到 目前 为 止 ， 你 见 到 的 代码 片段 大 多 只 
有 几 行 ， 旨 在 演示 某 项 Python 功能 。 编 程 新 本 章 内 容 
手 会 很 快 发 现 ， 将 小 小 的 代码 片段 组 织 成 完 
整 的 程序 是 一 大 步 。 要 编写 规模 较 大 的 程序 ， 
必须 更 详尽 地 规划 ， 还 需 对 如 何以 最 佳 方式 D 保留 想 要 的 字母 
结合 使 用 各 项 Python 功能 有 所 了 解 。 刚 开始 本 
编写 较 大 的 程序 时 ， 可 能 需要 反复 试验 。 Ne 
口 找 出 出 现 次 数 较 多 的 单词 


本 章 将 循序 渐进 地 开发 一 个 较 大 的 Python 


口 问题 描述 


程序 。 首 先 对 要 解决 的 问题 进行 描述 ， 然 后 口 将 字符 串 转换 为 次 数字 典 
人 站 
行 测试 。 

口 练习 


程序 编写 工作 很 杯 手 ， 但 要 演示 这 一 点 

很 难 。 看 起 来 有 了 清晰 的 问题 描述 后 ， 我 们 口 最 终 的 程序 
就 找到 了 简洁 的 解决 方案 ; 但 实际 上 绝 不 可 
能 如 此 简单 : 需要 反复 试验 , 开始 会 遭遇 失败 ， 
还 常常 需要 推倒 重 来 。 通 过 编写 程序 ， 你 将 
逐渐 学 会 合并 使 用 各 种 技术 的 最 佳 方 式 ， 并 
了 解 哪些 解决 方案 通常 对 解决 哪些 问题 行 之 
有 效 。 


11.1 问题 描述 


受 邀 为 解决 重要 问题 而 编写 程序 时 ， 编 
程 新 手 常 党 不 知道 从 何 处 着 手 。 至 少 从 笼统 
的 角度 说 ， 答 案 很 简单 : 编写 大 型 程序 时 ， 
先 得 明白 要 解决 的 问题 。 这 看 似 简单 ， 但 未 
能 正确 认识 要 解决 的 问题 是 极其 常见 的 编程 
错误 。 有 时 候 ， 编 写 程序 之 所 以 很 难 ， 是 因 
为 你 没有 真正 明白 自己 要 做 什么 。 


本 章 要 解决 的 问题 是 ， 计 算 并 打印 有 关 
文本 文件 内 容 的 统计 数据 。 我 们 想 知 道 给 定 
文本 文件 包含 多 少 个 字符 、 行 和 单词 。 除 单 
词 数 外 ， 我 们 还 想 知道 在 文件 中 出 现 次 数 最 
多 的 前 10 个 单词 ， 并 按 出 现 次 数 排列 它们 。 


来 看 一 个 包含 一 小 段 文 本 的 例子 。 

A long time ago, in a galaxy far, far away ... 

它 包含 如 下 内 容 。 

口 一 行文 本 。 我 们 假定 换行 字符 (\n) 
被 用 于 标识 行 尾 ， 且 不 为 空 的 文本 文 
件 至 少 包含 一 行 。 

口 46 个 字符 ， 包 括 空格 和 标点 在 内 。 


口 总 共 10 个 单词 。 然 而 ， 不 同 的 单词 只 
有 8 个 ， 因 为 far 和 A 都 出 现 了 两 次 。 


在 Python 解释 器 中 进行 试验 很 有 和 帮助， 
例如 : 


>>> s = 'A long time ago, in a galaxy far, 
» far away ...' 


>>> len(s) 

46 

>>> s.split() 

['A', 'long', 'time', 'ago,', 'in', 'a', 

“palaxy ys. "fary’s." far's aWay” ys ase" 

正如 你 看 到 的 ， 函 数 len 指出 这 个 字符 
串 包含 46 个 字符 ; 函数 split 将 字符 串 划 分 
为 单词 一 一 如 果 和 忽略 末尾 的 .….， 字 符 串 s 总 
共 包 含 10 个 单词 。 


如 果 仔 细 查 看 split 返回 的 单词 列表 ， 
将 发 现 单词 far 出 现 了 两 次 ,但 split 将 它们 
视 为 两 个 不 同 的 字符 串 :“far,”( 末尾 有 逗号 ) 
和 “far”( 没有 有 逗号 )。 同样, A 和 a 也 是 相 
同 的 单词 ， 只 是 大 小 写 不 同 。 
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为 处 理 上 述 细 节 ， 我 们 将 精确 地 定义 字 
符 串 为 单词 的 含义 : 单词 是 包含 一 个 或 多 个 
字符 的 字符 串 ， 其 中 每 个 字符 都 必须 是 小 写 
字母 a~z。 我 们 将 忽略 非 字 母 字 符 ( 如 数字 和 
标点 )， 并 将 大 写字 母 转换 为 小 写 。 因 此 前 面 
的 示例 如 下 。 


原始 文本 : Alongtime ago, in a galaxy far, 
far away .… 
修改 后 的 文本 : alongtime ago in a galaxy 


far far away 


通过 将 修改 后 的 句子 划分 为 单词 ， 得 到 
的 结果 更 准确 : 


>>> 七 = 'a long time ago in a galaxy 
» far far away 

>>> t.split() 

['a', 'long', 'time'’, 'ago', 'in'’, 'a', 
» 'galaxy', 'far', 'far', 'away'] 

>>> len(t.split()) 

10 


要 计算 不 同 的 单词 数 ， 可 将 列表 转换 为 
集合 ( 本 书 前 面 介绍 过 ,集合 不 存储 重复 的 
值 ): 


>>> set(t.split()) 

{'a', 'ago', 'far', 'away', 'time', 'long', 
* 'in', 'galaxy'} 

>>> len(set(t.split())) 

8 


删除 非 字 母 字 符 存在 一 些 缺 点 。 首 先 ， 
字符 数 不 对 ， 因 为 有 些 字符 被 删除 。 但 我 们 
可 采取 这 样 应 对 的 措施 ， 即 在 修改 前 计算 字 
符 数 。 其 次 ， 对 于 有 些 单词 ， 没 有 将 其 标点 
符号 删除 的 好 办 法 。 例 如 ， 该 如 何 处 理 Td 中 
的 撒 号 呢 ? 如 果 将 其 删除 ( 并 将 I 转换 为 小 
写 )， 结 果 将 为 这 ， 与 原来 的 单词 不 同 。 如 有 果 
将 撤 号 殖 换 为 空格 ,结果 将 为 1 和 d 一 一 一 个 
是 单词 ， 一 个 不 是 。 为 解决 这 个 问题 ， 我 们 
将 撤 号 (还 有 连 字符 ) 视 为 字母 。 第 三 ， 改 
变 大 小 写 可 能 改变 单词 的 含义 。 例 如 ， 将 有 
些 名 字 的 首 字 母 小 写 后 ， 它 将 变 成 单词 ， 如 
Polish (polish ) 和 Bonnie (bonnie )。 我 们 
不 考虑 这 个 问题 ， 因 为 它 看 起 来 并 非 什 么 大 
问题 。 
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11.2 保留 想 要 的 字母 


接 下 来 ， 考虑 如 何 自动 将 字符 串 转 换 为 
所 需 的 格式 。 将 字符 串 转 换 为 小 写 很 容易 ， 
如 下 所 示 。 


>>> s = "I'd like a copy!" 
>>> s.lower() 


"i'd like a copy!" 


删除 不 想 要 的 字符 有 点 赫 手 ， 一 种 办 法 
是 使 用 字符 串 函 数 replace 将 不 要 的 字符 替换 
为 空 字符 ， 例 如 


>>> s = "Id like a copy!" 
>>> s.replace('!', '') 


"I'd like a copy" 


这 种 做 法 的 问题 在 于 ， 需 要 调用 replace 
很 多 次 : 每 种 不 需要 的 字符 一 次 。 相 比 于 要 
保留 的 字符 ， 要 删除 的 字符 多 得 多 ， 因 此 这 
种 做 法 的 效率 极 低 。 


函数 normalize 的 另 一 个 版 本 

下 面 是 实现 函数 normalize 的 更 简洁 
方式 : 

def normalize2(s): 


'""Convert s to normalized string. 


return ''.join(c for c in s.lower() 
if c in keep) 


很 多 经 验 丰 富 的 程序 员 都 喜欢 这 个 版 
本 ， 它 更 简洁 ， 且 至 少 在 他 们 看 来 易 
于 理解 。 
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正则 表达 式 

解决 这 个 问题 的 另 一 种 方法 是 使 用 正 
则 表达 式 。 例 如 ， 可 创建 一 个 定义 单词 的 
正则 表达 式 ， 再 使 用 函数 findall 提取 给 
定 字符 串 中 的 所 有 单词 。 鉴 于 我 们 要 显示 
基本 的 Python 编程 ， 因 此 不 会 在 后 续 代 码 
中 使 用 任何 正则 表达 式 。 


一 种 更 佳 的 方法 是 保留 想 要 的 字母 ， 
例如 : 


\# 包含 所 有 要 保留 的 字符 的 集合 
keep = {'a'’, 'b', 'c', 'd', 'e', 
二， 8 ， 'h', "i 'j', 
"es "Ls "my "Ms "0, 
dy Ty 
Ws Ws Ws NY 
‘7 


def normalize(s): 


"""Convert s to a normalized string. 


result = "" 
for c in s.lower(): 
if c in keep: 
result += 人 C 


return result 
这 个 函数 以 每 次 一 个 字符 的 方式 遍历 字 
符 串 s， 仅 当 字 符 包 含 在 要 保留 的 字符 集合 中 
时 ， 才 将 其 附加 到 result 末尾 。 
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11.3 ”使 用 大 型 数据 文件 测试 代码 


我 们 编写 的 代码 不 多 ,但 足够 做 一 些 
有 用 的 实验 。 在 下 面 的 示例 中 ， 我们 将 使 
用 文件 bil.txt， 这 是 一 个 5.4 MB 的 文本 文 
件 ， 包含 莎 士 比 亚 的 全 部 作品 ， 可 从 Project 
Gutenberg 网 站 www.gutenberg.org 免费 下 载 。 
这 个 文件 比较 大 ， 非 党 适合 用 于 测试 前 述 代 
码 的 效率 。 


要 处 理 文 本 文件 ， 方 式 之 一 是 将 整个 文 
件 作为 一 个 字符 串 读 取 到 内 存 中 。 下 面 在 解 
释 需 中 手工 完成 这 项 任务 。 


>>> bill = open('bill.txt', 'r').read() 
>>> len(bill) 

5465395 

>>> bill.count('\n') 

124796 

>>> len(bill.split()) 

904087 

>>> len(normalize(bill).split()) 
897610 


从 输出 可 知 ， 这 个 文件 包含 大 约 540 万 
个 字符 、 大 约 12.5 万 行 、 大 约 90 万 个 单词 。 
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下 面 将 所 有 代码 放 在 一 个 函数 中 ， 以 自 
动 完成 这 项 任务 : 


def file stats(fname): 
"""Print statistics for the given 
file. 
s = open(fname, 'r').read() 
num chars = len(s) 
num lines = s.count('\n') 


num words = len(normalize(s). split()) 


print("The file '%s' has: " % fname) 
print("”  %s characters" % num chars) 
print(" %s lines" % num lines) 


print("  %s words" % num words) 
调用 函数 file_stats 得 到 的 输出 如 下 : 


>>> file stats('bill.txt') 
The file 'bill.txt' has: 
5465395 characters 
124796 lines 
897610 words 


在 我 的 计算 机 上 ， 运 行 这 个 也 数 需要 
大 约 1 秒 钟 ， 这 包括 将 文件 加 载 到 内 存 以 及 
完成 所 有 处 理 所 需 的 时 间 。 对 一 个 简单 的 
Python 程序 来 说 很 不 错 ! 
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11.4” 找 出 出 现 次 数 较 多 的 单词 


来 考虑 如 下 问题 : 找 出 文本 文件 中 出 现 
次 数 较 多 的 单词 。 这 里 的 解决 方案 是 ， 创 建 
一 个 字典 ， 其 中 的 键 为 单词 ， 值 为 单词 在 文 
件 中 出 现 的 次 数 。 


例如 ,对 于 前 面 的 示例 文本 ( 经 过 规范 化 ): 
a [ong time ago in a galaxy far far away 


各 个 单词 出 现 的 次 数 如 下 : 


Li 
galaxy: 1 
far: 2 


away: 1 


如 果 我 们 将 上 述 内 容 转 换 为 一 个 Python 
字典 ， 结 果 将 类 似 于 下 面 这 样 : 


d={ 
i 2 
"long': 1， 
‘time'’: 1， 
ago': 1， 
"ny 
'galaxy': 1， 
far 2, 
"away': 1 

} 


184 第 11 章 案例 研究 : 文本 统计 
图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 


可 从 这 个 字典 提取 很 多 有 用 的 信息 。 


口 d.keys() 是 一 个 列表 ， 包 含 文件 中 所 
有 不 同 的 单词 。 


D len(d.keys()) 是 文件 中 不 同 的 单词 数 。 


口 sum(d[k] for k in d) 是 d 中 所 有 值 
之 和 ， 即 文件 包含 的 单词 总 数 (包括 
重复 的 单词 )。sum 是 一 个 Python 内 置 
函数 ， 返 回 序列 的 总 和 。 


字典 存储 的 数据 未 经 排序 ， 因 此 要 获取 
一 个 清单 ， 按 出 现 次 数 从 高 到 低 的 顺序 列 出 
所 有 单词 ， 需 要 将 字典 转换 为 元 组 列表 ， 如 


下 所 示 。 
lst = [] 
for k in d: 


pair = (d[k], k) 
lst.append(pair) 
# 
# [(2, 'a'), (1, ago )， 
# (1, 'galaxy'), (1, 'time'), 
# (2; "far' ) a] 
lst.sort() 
# 
# [(1, ‘ago'), (1, ‘away'), 
# (1, 'galaxy'), (1,'in'), 
# (1 Long )sy sa] 
lst.reverse() 
# 
# [(2,'far'), (2,'a'), 
# (1, 'time'), (1, 'long'), 
Cy. sim) | 
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其 中 的 for 循环 将 字典 d 转换 为 由 元 组 
(count,word) 组 成 的 列表 。 经 过 这 样 的 转换 后 ， 
就 可 使 用 列表 函数 sort 按 出 现 次 数 对 数据 排 
序 。 默 认 情 况 下 ， 函 数 sort 按 从 小 到 大 的 顺 
序 排 列 数 据 ， 因 为 我 们 反 转 列表 的 排列 顺序 ， 
将 出 现 次 数 最 多 的 单词 (通常 也 是 我 们 最 感 
兴趣 的 单词 ) 放 在 列表 开头 。 


三 


将 lst 中 的 单词 按 出 现 次 数 从 高 到 低 排 
列 后 ， 就 可 使 用 切片 来 获取 出 现 次 数 最 多 的 3 
个 单词 : 


print(lst[:3]) 

# 

# [(2,'far'), (2,'a'), 
# (1, 'time')] 


如 果 要 让 输出 更 整洁 ， 可 以 这 样 做 : 


for count, word in lst: 


print('%4s %s' % (count, word)) 
上 述 代 码 的 输出 如 下 : 


2 far 

2 3 

1 time 

1 long 

1 in 

1 galaxy 
1 away 


1 ago 


注意 到 在 每 个 单词 的 出 现 次 数 前 面 ， 都 
有 3 个 空格 。 这 是 因为 print 语句 包含 格式 命 
令 %45, 它 让 数字 在 宽度 为 4 的 字段 中 右 对 齐 。 
只 要 没有 单词 出 现 的 次 数 达 到 或 超过 1000， 
这 就 可 确保 出 现 次 数 完全 对 齐 。 
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11.5 “将 字符 串 转 换 为 次 数字 典 

下 面 来 编写 一 个 函数 ， 它 接受 字符 串 S 
并 生成 一 个 字典 ， 该 字典 的 键 为 s 中 的 单词 ， 
值 为 单词 出 现 的 次 数 : 


def make freq dict(s): 
"""Returns a dictionary whose keys 
are the words of s, and whose 
values are the counts of those 


words. 


s = normalize(s) 
words = s.split() 
d = {} 
for w in words: 
if w in d: \ 进 看 到 W 出 现 过 ? 
d[w] += 1 
else: 
d[w] = 1 


return d 


这 个 函数 遍历 字符 串 s 的 每 个 单词 ， 并 
将 其 加 入 到 字典 中 。 如 果 w 是 包含 在 d 中 的 键 ， 
if 语句 if w in d 的 条 件 将 为 True， 否 则 为 
False。 如 果 w 是 包含 在 d 中 的 键 ， 则 说 明 w 
出 现 过 ， 因 此 将 其 出 现 次 数 加 1; 如 果 w 未 包 
含 在 d 中 ， 就 使 用 语句 d[w] = 1 将 其 作为 新 
键 加 入 到 字典 中 。 
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11.6 ”组 织 在 一 起 


现在 万 事 俱 备 ， 可 以 编写 一 个 函数 ， 计 
算 并 显示 给 定 文 本 文件 的 统计 数据 : 


def print file stats(fname): 
"""Print statistics for the given file. 
s = open(fname, 'r').read() 
num chars = len(s) # 在 规范 化 s 之 前 计算 字符 数 
num lines = s.count('\n') # 在 规范 化 s 之 前 计算 行 数 
d = make freq dict(s) 
num words = sum(d[w] for w in d) # 计算 s 包含 多 少 个 单词 
# 创建 一 个 列表 ， 其 中 的 元 素 由 出 现 次 数 和 单词 组 成 的 元 组 
# 并 按 出 现 次数 从 高 到 低 排列 
lst = [(d[w], w) for w in d] 
lst.sort() 
lst.reverse() 
# 在 屏幕 上 打印 结果 
print("The file '%s' has: " % fname) 
print("  %s characters" % num chars) 
print("” %s lines" % num lines) 
print("  %s words" % num words) 
print("\nThe top 10 most frequent words are:") 
i = 1 # 斌 为 列表 元 素 编 号 
for count, word in lst[:10]: 
print('%2s. %4s %s' % (i, count, word)) 


i+= 1 


188 第 11 章 案例 研究 : 文本 统计 
图 灵 社区 会 员 cindy282694 专 享 尊重 版 权 


调用 这 个 函数 并 将 文件 bill.txt 传递 给 它 ， 
将 得 到 如 下 打印 输出 : 


The file 'bill.txt' has: 


5465395 characters 
124796 lines 
897610 words 


The top 10 most frequent words are: 


1 


2. 


‘OO co ~ cm 上 上 ww 


10. 


27568 the 
26705 and 


。20115 i 
. 19211 to 
. 18263 of 
。 14391 a 
. 13606 you 
. 12460 my 


. 11107 that 


11001 in 


这 个 单词 清单 完全 在 意料 之 中 ， 虽 然 不 
那么 激动 人 心 。 在 英语 文本 中 ， 出 现 频 度 最 
高 的 单词 几乎 都 是 很 小 的 功能 词 ， 如 the 和 
and。 你 必须 往 下 找 , 才能 找到 更 有 趣 的 单词 。 


在 我 的 计算 机 (典型 的 台式 机 ) 上 ， 这 
个 程序 的 执行 时 间 不 到 1.5 秒 ; 考虑 到 文件 如 
此 之 大 ， 这 样 的 结果 相当 不 错 。 
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11.7 练习 


1. 修改 函数 print _ file_ stats， 使 其 也 
打印 文件 中 不 同 的 单词 总 数 。 


2. 修改 函数 print_ file _stats， 使 其 打 
印 文件 中 单词 的 平均 长 度 。 


3. 军用 语 (hapax legomenon ) 是 在 文件 
中 只 出 现 过 一 次 的 单词 。 请 修改 函数 
print file stats， 使 其 打印 罕 用 语 总 
数 。 


4. 前 面 说 过 ,文件 billtxt 中 出 现 频率 
最 高 的 10 个 单词 都 是 功能 词 ， 如 the 
和 and。 我 们 通常 对 这 些 单 词 不 感 兴 
趣 ， 因 此 我 们 可 创建 一 个 排除 词 ( stop 
word ) 集合 ， 其 中 包含 要 忽略 的 所 有 
单词 。 


在 函数 print_file_stats 中 新 增 一 个 名 
为 stop_words 的 变量 ， 如 下 所 示 : 


stop words = {'the', 'and'’, 'i', 'to', 'of', 

» "a'’, 'you'’, 'my', 'that', 'in'} 

当然 ， 你 可 根据 自己 的 喜好 修改 排除 词 
集合 。 现 在 ， 修 改 程序 的 代码 ， 在 计算 所 有 
统计 数据 时 ， 都 将 stop_list 中 的 单词 排除 
在 外 。 
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5.( 较 难 ) 函数 print file _ stats 将 一 个 
文件 名 作为 输入 ， 并 将 整个 文件 都 读 
取 到 一 个 字符 串 变 量 中 。 这 种 做 法 的 
问题 在 于 ， 如 果 文 件 很 大 ， 将 整个 文 
件 都 放 在 一 个 字符 如 变量 中 将 占用 大 
量 内 存 。 


另 一 种 做 法 是 以 每 次 一 行 的 方式 读 取 文 
件 ， 这样 占 用 的 内 存 通常 少 得 多 。 


请 编写 一 个 名 为 print_file stats_lines 
的 新 子 数 ， 其 功能 与 print_file_stats 完全 
相同 ， 但 逐 行 读 取 输 入 文件 。 使 用 相同 的 文 
件 调 用 这 两 个 函数 时 ， 它 们 的 输出 应 该 相同 。 
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11.8 ”最终 的 程序 
最 终 的 程序 代码 如 下 : 


# wordstats.py 

# 包含 所 有 要 保留 的 字符 的 集合 

keep = {'a'’, 'b', 'c', 'd', 
$ 谍 党 'h', 于 'j 3 
es Es mp Ns Os 
"De Ss 


i 
U,V, WW, XxX, y,，, 


def normalize(s): 


"""Convert s to a normalized string. 


nn 


result = 

for c in s.lower(): 
if c in keep: 
result += 人 C 


return result 


def make freq dict(s): 
"""Returns a dictionary whose keys are the words of s, and whose values 
are the counts of those words. 
s = normalize(s) 
words = s.split() 
d = {} 
for w in words: 
if w in d: # 如 果 W 出 现 过 ， 就 将 其 出 现 次 数 加 1 
d[w] += 1 
else: 
d[w] = 1 # 如 果 wW 是 第 一 次 出 现 ， 就 将 其 出 现 次 数 设置 为 1 


return d 
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def print file stats(fname ) : 


"""print statistics for the given file. 


s = open(fname, 'r').read() 


num chars = len(s) # 在 规范 化 s 之 前 计算 字符 数 
num lines = s.count('\n') # 在 规范 化 s 之 前 计算 行 数 


d = make freq dict(s) 


num words = sum(d[w] for win d)  # 计算 s 包含 多 少 个 单词 


# 创建 一 个 列表 ， 其 中 的 元 素 由 出 现 次 数 和 单词 组 成 的 元 组 
# 并 按 出 现 次 数 从 高 到 低 排列 

lst = [(d[w]，w) for win d] 

lst.sort() 


lst.reverse() 


# 在 屏幕 上 打印 结果 

print("The file '%s' has: " % fname) 
print(”  %s characters" % num chars) 
print(”  %s lines" % num lines) 


print("  %s words" % num words) 


print("\nThe top 10 most frequent words are:") 
i = 1 # 斌 为 列表 元 素 编 号 
for count, word in lst[:10]: 

print('%2s. %4s %s' % (i, count, word)) 


i+= 1 


def main(): 
print file stats('bill.txt') 


if name == "' main 


main() 
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Ce 


深 有 党 欢迎 的 Python 包 


Python 深 受 欢迎 的 原因 之 一 是 有 大 量 高 
品质 的 库 ， 可 帮助 完成 各 种 软件 任务 。 附 录 
A 将 介绍 几 个 深 受 欢迎 的 包 。 


在 这 些 库 中 ， 很 多 都 只 支持 特定 的 
Python 版 本 (Python 可 从 www.python.org 免 
费 下 载 )， 牢 记 这 一 点 很 有 帮助 。 具 体 地 说 ， 
很 多 包 还 不 支持 Python 3， 因 此 要 使 用 它们 ， 
您 可 能 需要 使 用 Python 2.6 (或 更 晚 的 版 本 )。 
所 地 的 是 ， 如 果 您 熟悉 Python 3， 回 过 头 去 
使 用 Python 2 并 不 难 。 附 录 B 简要 地 讨论 了 
Python 2 和 Python 3 之 间 的 一 些 重大 差别 。 


口 一 些 深 受 欢迎 的 Python 包 


一 些 深 受 欢迎 的 Python 包 


PIL: Python 图 像 处 理 库 


PIL (http://www.pythonware.com/products/ 
pilindex.htm ) 是 一 个 图 像 处 理 库 ， 支 持 众 多 
图 像 格式 ， 可 用 于 执行 裁剪 、 大 小 调整 、 旋 
转 和 滤 镜 效果 等 操作 。 


Tkinter: Python GUI 


Tkinter 是 Python 库 自 带 的 ， 是 访问 流行 
工具 包 Tk GUI 的 标准 方式 。 如 果 您 要 使 用 
Python 创建 图 形 用 户 界面 (GUI )， 应 首先 考虑 
使 用 这 个 包 。 有 关 这 个 包 的 更 详细 信息 ， 请 参 
阅 http:/docs.python.org/3/library/tkinterhtml。 


Django: 交互 式 网 站 


Django (www.djangoproject.com ) 是 一 个 
用 于 创建 交互 式 网 站 的 框架 。 从 这 种 意义 上 
说 ， 它 类 似 于 Ruby on Rails， 但 使 用 的 底层 
编程 语言 是 Python 而 不 是 Ruby。 


Bottle: 交互 式 网 站 


Bottle ( http://bottlepy.org/docs/dev/ ) 类 似 
于 Django， 因 为 它 也 是 一 个 用 于 创建 交互 式 
网 站 的 框架 。 by Bottle 是 一 个 轻 量 级 
的 小 型 框架 ， 可 能 更 适合 用 于 开发 小 型 网 站 。 
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- 


Pygame: 2D 动画 


Pygame (www.pygame.org ) 让 您 Se 
和 控制 二 维 动画 ， 尤 其 适合 用 于 开发 游戏 。 
提供 了 创建 动画 和 声音 的 工具 ， 还 提供 | 
游戏 杆 等 输入 设备 的 工具 。Pygame 网 站 还 提 
供 了 初步 教程 和 示例 程序 , 可 帮助 您 快速 上 手 。 


SciPy: 科学 计算 


SciPy (www.scipy.org ) 是 一 个 用 于 科学 
计算 的 大 型 软件 工具 库 ， 深 受 大 家 的 欢迎 ， 
还 有 专门 的 会 议 ! 它 提 供 的 数学 软件 让 您 能 
够 完成 如 下 任务 : 求解 最 优化 问题 、 执 行 线 
性 代数 数字 计算 、 处 理 信 号 等 。 


Twisted: 网 络 编程 


Twisted ( http://twistedmatrix.com/trac ) 是 
一 个 深 受 欢迎 的 Python 网 络 编程 库 ， 支 持 众 
a 可 用 于 开发 Web 服务 咒 、 邮 件 
服务 器 和 聊天 客户 端 / 服务 器 等 。 


PyPl: Python 包 索 引 


Python 包 索 引 (http:/pypi.python.org/ 
pypi ) 是 一 个 更 新 频繁 的 清单 ， 列 出 了 数 千 
个 用 户 提交 的 Python 包 。 如 果 要 ee 
Python 库 或 了 解 Python 已 用 于 哪些 方面 ， 这 
是 一 个 不 错 的 地 方 。 


在 网 上 搜索 可 轻松 找到 数 千 个 其 他 的 


Python 库 。 无 论 是 什么 编程 任务 ， 只 要 有 人 
做 过 ， 几 乎 都 有 相关 的 Python 库 ! 
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比较 Python 2 和 Python 3 


Python 3 发 布 于 2008 年 底 ， 是 一 次 重 


大 的 Python 升级 。Python 3 的 有 些 改进 不 向 本 章 内 容 
后 与 Python 2 兼容 ， 因 此 了 Python 2 始终 与 D Python 3 新 增 功能 
Python 3 并 行 地 向 前 发 展 。 


附录 B 概述 Python 3 的 一 些 重大 改进 ， 阅 
述 如 何 将 Python 2 程序 转换 为 Python 3 程序 。 


Python 3 新 增 功能 


Python 3 新 增 了 很 多 功能 ， 一 些 最 显著 的 
新 功能 如 下 。 


口 在 Python 3 中 ,print 是 货真价实 的 函 
数 ; 而 在 Python 2 中 ，print 是 个 语言 
结构 ， 像 if 和 for 一样。 在 Python 2 
中 ，print 存在 的 问题 是 难以 修改 ， 例 
如 ， 在 Python 3 中 ， 修 改 print 语句 
使 其 打印 到 文件 而 不 是 控制 台 要 容易 
得 多 ， 因 为 只 需 给 函数 print 重新 赋 
值 即 可 。 


口 在 Python 3 中 ， 整 数 除法 的 结果 完全 
符合 预期 : 
Python3>>> 1 / 2 


0.5 

然而 ， 在 Python 2 中 执行 整数 除法 时 ， 
将 删除 小 数 部 分 : 

Python2>>> 1 / 2 


0 


虽然 Python 2 的 整数 除法 方式 也 得 到 
了 其 他 编程 语言 的 支持 ， 但 很 多 程序 
员 都 认为 它 有 悖 于 直觉 ， 可 能 导致 微 
妙 的 错误 。 


口 Python 2 有 两 种 类 : 老式 类 和 新 式 类 ， 
而 Python 3 完全 抛弃 了 老式 类 。 


口 Python 3 重 命名 了 两 个 重要 的 函数 : 
函数 input 和 range 在 Python 2 中 分 
别名 为 raw_input 和 xrange。 


口 第 9 章 介 绍 的 格式 字符 串 只 有 Python 
3 文 持 ，Python 2 不 文 持 。Python 2 只 
支持 使 用 运算 符 % 的 字符 串 揪 入 。 
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在 技术 方面 ,Python 3 还 做 了 众多 其 他 
的 改进 。 要 全 面 了 解 Python 3 和 了 Python 2 之 
间 的 差异 ， 请 参阅 What’s New in Python 3.0 
( http://docs.python.org/3/whatsnew/3.0.html )。 


将 Python 2 程序 转换 为 Python 3 程序 通 
党 不 难 ， 有 一 个 工具 可 助 一 辟 之 力 ， 它 就 是 
2to3 (http://docs.python.org/3/library/2to3.html )， 
几乎 能 够 将 任何 Python 2 程序 自动 转换 为 等 
价 的 Python 3 程序 。 


该 使 用 哪个 Python 版 本 


决定 使 用 哪个 Python 版 本 (Python 2 还 
是 Python 3 ) 时 ， 需 要 考虑 以 下 几 个 因素 。 


口 如 果 必 须 使 用 Python 2 程序 ， 可 能 应 
选择 Python 2; 和 否则， 就 得 将 既 有 的 
Python 2 程序 转换 为 Python 3 程序 ， 
而 这 可 能 很 难 。 


口 有 些 专 用 库 只 支持 菜 个 Python 版 
本 ， 如 果 需 要 使 用 这 样 的 库 ， 在 选择 
Python 版 本 方面 可 能 受到 限制 。 


口 如 果 你 刚 从 事 编 程 工作 ， 不 用 维护 老 
式 Python 程序 ， 也 无 需 使 用 专用 库 ， 
那么 使 用 Python 3 可 能 是 最 佳 选 择 。 
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剥 除 函数 95 
捕获 异常 146 


C 


参数 self 155 
测试 函数 92 

拆 分 函数 95 

重 写 方法 170 
处 理 文本 文件 134 


D 


当前 工作 目录 130 
读 写 文件 128 
短路 求 值 48 

多 重 赋值 29 

多 态 153, 171 


F 


for 86 

for 循环 54 
返回 值 16 

方法 display 157 
浮 点 数 算术 13 
负数 索引 85 
赋值 69 

赋值 语句 26 


G 


get age() 146 


get_move 也 数 172 
格式 字符 串 126 
关键 字 参 数 79 


获取 函数 153 


if 语句 49 
if/elif 语句 52 
if/else 语句 49 


J 


集合 122 
计算 阶乘 59 
继承 1S3，168 
解释 器 4 


L 
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列表 108 
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名 称 空间 82 
模板 包 126 
模块 math 16 
默认 值 78 


P 


.pyc 文件 4 

pickle 139 
play_undercut 174 
Pygame 197 

PyPI 197 

Person 对 象 155 
Python 包 195 

Python 模块 80 

Python 图 像 处 理 库 196 


Q 


清理 操作 150 
全 局 变量 74 


S 


SciPy 197 
shell 提示 符 10 
设置 函数 153 
输出 123 

输入 123 

私有 变量 166 
搜索 函数 93 


T 


Tkinter 196 
try/except 块 148 
Twisted 197 
type 命令 101 
特性 装饰 咒 163 
替换 函数 96 
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通用 接口 174 


U 


Undercut 173 
urllib 141 


V 


ValueError 146 


W 


webbrowser 141 
while 循环 56 
with 语句 151 
文本 统计 177 
文件 夹 130 


X 


显示 对 象 156 
序列 103 
循环 54 

Y 

异常 143 
溢出 14 

元 组 104 

元 组 函数 106 
源 代码 注释 41 


Z 


正则 表达 式 98 
转换 说 明 符 125 
转 义 字符 88 
字典 函数 120 
字符 87 

字符 串 83 
字符 串 插 入 124 
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Python Essential Reference ETTETEET 


Python 参考 手册 
(第 4 版 ) 


( 糯 | David M. Beazley 着 
谢 俊 杨 墟 高 伟 译 


量 经 典 著作 全 面 升 级 
名 Python 程序 员 案头 必 备 
量 涵盖 Python 2 和 Python 3 共有 特性 


会 员 cindy282694 专 享 尊 


Python 是 一 种 解释 型 、 面 向 对 象 、 动 态 数 据 类 型 的 高 级 程序 设计 语言 ， 自 20 世 纪 90 年 代 初 诞生 至 今 ， 
逐渐 被 广泛 应 用 于 处 理 系统 管理 任务 和 Web 编 程 。 

本 书 用 通俗 易 懂 的 语言 结合 常见 任务 、 屏 幕 图 和 详细 的 解释 ， 循 序 渐 进 地 介绍 了 Python 的 基础 知识 ， 助 
你 轻松 、 迅 速 地 学 习 Python。 书 中 没有 深奥 的 理论 或 者 高 级 应 用 ， 非 常 适合 用 来 自学 。 读 罢 本 书 ， 你 定 能 掌 
握 Python 的 各 项 基础 知识 ， 成 为 一 名 真正 的 Python 程序 员 ! 


助 你 快速 上 手 。 
值得 反复 品味 。 


从 算术 运算 、 字 符 串 、 变 量 ， 到 函数 、 数 据 结 构 、 输 入 输出 
和 异常 处 理 ， 应 有 尽 有 1! 


https://code.google.com/p/pythonintro/ 上 提供 了 示例 程序 及 其 他 材料 。 
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Press 


新 浪 微 博 : @ 图 灵 教 育 @ 图 灵 社 区 
反馈 /投稿 /推荐 信箱 : contact@turingbook.com 
热线 : (010)51095186 转 604 


计算 机 /软件 开发 ISBN 978-7-115-33374-2 


人 民 邮 电 出 版 社 网 址 : www.ptpress.com.cn 定价 : 39.00 元 


中 & ISBN 978-7-115-33374-2 
图 灵 社 区 : www .ituring.com.cn ] ] | 
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欢迎 加 入 


图 灵 社 区 


电子 书 发 售 平台 


电子 出 版 的 时 代 已 经 来 临 ， 在 许多 出 版 界 同行 还 在 犹豫 往复 的 时 候 ， 图 灵 社 区 已 经 
采取 实际 行动 拥抱 这 个 出 版 业 巨 变 。 相 比 纸 质 书 ， 电 子 书 具有 许多 明显 的 优势 。 它 
不 仅 发 布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 片 〈 即 使 有 的 书 纸 质 版 是 黑白 印 
刷 的 ) 。 读 者 还 可 以 方便 地 进行 搜索 、 剪 贴 、 复 制 和 打印 。 


图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 出 版 业务 紧密 结合 ， 目 前 已 实现 作 译 者 网 上 
交 稿 、 编 辑 网 上 审 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模式 ， 我 们 称 之 为 
“敏捷 出 版 ”， 它 可 以 让 读者 以 较 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 
以 往 翻译 版 技术 书 “ 出 版 即 过 时 ”的 缺憾 。 同 时 ， 敏 捷 出 版 使 得 作 、 译 、 编 、 读 的 
交流 更 为 方便 ， 可 以 提前 消灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 的 质量 。 


开放 出 版 平台 


图 灵 社 区 向 读者 开放 在 线 写作 功能 ， 协 助 你 实现 自 出 版 的 梦想 。 你 可 以 联合 二 三 好 
友 共 同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 的 形式 提供 给 读者 ， 这 极 大 地 降低 了 出 
版 的 门槛 。 成 熟 的 书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 


图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 社区 公布 。 如 果 有 意 翻译 哪 本 
图 书 ， 欢 迎 来 社区 申请 。 只 要 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 译 者 。 当 然 ， 
要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 需要 有 坚强 的 毅力 的 。 


读者 交流 平台 
在 图 灵 社 区 ， 读 者 可 以 十 分 方便 地 写作 文章 、 提 交 勘 误 、 发 表 评 论 ， 以 各 种 方式 与 


作 译 者 、 编 辑 人 员 和 其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 银子 。 欢 迎 
大 家 积极 参与 社区 开展 的 访谈 、 审 读 、 评 选 等 多 种 活动 ， 赢 取 银 子 ， 可 以 换 书 哦 ! 
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